文本編碼與解碼問題解決方案


文本的編碼與解碼問題,其中很常見的一種解碼錯誤如下所示:

        問題一   UnicodeDecodeError: 'gbk' codec can't decode byte 0x93 in position 130: illegal multibyte sequence

 

  • (首先在打開文本的時候,設置其編碼格式,

            例:open(‘1.txt’,encoding=’gbk’);

  • 如果文本中出現的一些特殊符號超出了gbk的編碼范圍,那么使用上述方法依舊不能正確解碼,我們使用編碼范圍更廣的‘gb18030’進行解碼

            例:open(‘1.txt’,encoding=’gb18030’); 

  • (3)、若之前兩種方法仍不能解決解碼問題,說明文中出現了連‘gb18030’也無法編碼的字符,可以使用‘ignore’屬性將無法解碼的特殊符號進行忽略處理,

           例:open(‘1.txt’,encoding=’gb18030’,errors=‘ignore’); 

 

       問題二    'gbk' codec can't decode byte 0x93 in position 5456: illegal multibyte sequence

  • 解決方式1     FILE_OBJECT= open('order.log','r', encoding='UTF-8')
  • 解決方式2       FILE_OBJECT= open('order.log','rb')


---------------------
參考:https://blog.csdn.net/shijing_0214/article/details/51971734

參考: https://www.cnblogs.com/mengyu/p/6638975.html


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM