文本的編碼與解碼問題,其中很常見的一種解碼錯誤如下所示:
問題一 UnicodeDecodeError: 'gbk' codec can't decode byte 0x93 in position 130: illegal multibyte sequence
- (首先在打開文本的時候,設置其編碼格式,
例:open(‘1.txt’,encoding=’gbk’);
- 如果文本中出現的一些特殊符號超出了gbk的編碼范圍,那么使用上述方法依舊不能正確解碼,我們使用編碼范圍更廣的‘gb18030’進行解碼
例:open(‘1.txt’,encoding=’gb18030’);
- (3)、若之前兩種方法仍不能解決解碼問題,說明文中出現了連‘gb18030’也無法編碼的字符,可以使用‘ignore’屬性將無法解碼的特殊符號進行忽略處理,
例:open(‘1.txt’,encoding=’gb18030’,errors=‘ignore’);
問題二 'gbk' codec can't decode byte 0x93 in position 5456: illegal multibyte sequence
- 解決方式1 FILE_OBJECT= open('order.log','r', encoding='UTF-8')
- 解決方式2 FILE_OBJECT= open('order.log','rb')
---------------------
參考:https://blog.csdn.net/shijing_0214/article/details/51971734
參考: https://www.cnblogs.com/mengyu/p/6638975.html