中文數據解碼報錯 UnicodeDecodeError: 'gbk' codec can't decode bytes in position 2-3: illegal multibyte sequence


UnicodeDecodeError: 'gbk' codec can't decode bytes in position 2-3: illegal multibyte sequence

失敗原因:原文件中文是UTF-8編碼,現在用gbk解碼則會報錯,編碼和解碼方法不一致所致;

解決辦法:先確認原文件數據的編碼格式,然后再確認現在對文件數據的解碼格式,需確保編碼格式和解碼格式一致

lines[i].decode('utf-8').encode('gbk')或者unicode(lines[i],'utf-8')均可以。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM