UnicodeDecodeError: 'gbk' codec can't decode byte 0xe9 in position 7581: illegal multibyte sequence


pyhon读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0xe9 in position 7581: illegal multibyte sequence

代码如下:

#获取电影列表
def getMovieList(item):
    items={}
    f=open(item,"r")
    # 此句报错
    movie_content=f.readlines()
    f.close()
    for movie in movie_content:
        movieLine=movie.split("|")
        items[int(movieLine[0])]=movieLine[1:]
    return items

这是Unicode编码不一致导致的,将f=open(item,"r")改为f=open(item,"r",encoding = 'ISO-8859-1')。

问题解决!!

在遇到这个问题时,不一定要改为'ISO-8859-1',unicode编码很多,一种不行可以多尝试几种。

Unicode编码有以下几种常见类型:

  gbk
  gb2312
  gb18030
  utf-8
  utf-16
  utf-32
  ISO-8859-1

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM