1. 先通過open函數指定編碼格式,代碼如下:
f1= open('/path/name','r', encoding='UTF-8')
# 或者
f1= open('/path/name','r', encoding='GBK')
2. 在使用上述方法都還報錯的時候,可以使用如下方法:
def read(file):
# 先使用二進制的方式讀取文件
with open(file, 'rb') as f:
res = ''
for line in f:
try:
# 然后一行一行地嘗試解碼
res += line.decode("utf-8").strip()
except:
pass
try:
res += line.decode("gbk").strip()
except:
pass
temp = res.split()
res = ''.join(temp)
return res