【E-06】UnicodeDecodeError: 'gbk' codec can't decode byte 0x93 in position 2740: illegal multibyte sequence


使用python的時候經常會遇到文本的編碼與解碼問題,其中很常見的一種解碼錯誤如題目所示,

1、編碼設置

第一行沒有設置 # _*_ coding:utf-8 _*_

2、后面處理數據時沒有轉碼下,如open函數上 處理如下:with open("data.txt",'r',encoding='UTF-8') as data:

3、網絡的其他解法:將'gbk'換成'utf-8'也適用。

(1)、首先在打開文本的時候,設置其編碼格式,如:open('1.txt',encoding='gbk');

(2)、若(1)不能解決,可能是文本中出現的一些特殊符號超出了gbk的編碼范圍,可以選擇編碼范圍更廣的'gb18030',如:open('1.txt',encoding='gb18030');

(3)、若(2)仍不能解決,說明文中出現了連'gb18030'也無法編碼的字符,可以使用'ignore'屬性進行忽略,如:open('1.txt',encoding='gb18030',errors='ignore');

(4)、還有一種常見解決方法為open('1.txt').read().decode('gb18030','ignore')

 

注意:若是使用了庫函數報這種錯誤,建議將庫函數單獨拷貝出來,再進行上述修改,否則會出現修改不成功的現象。

   

參考文獻:https://blog.csdn.net/shijing_0214/article/details/51971734


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM