中文数据解码报错 UnicodeDecodeError: 'gbk' codec can't decode bytes in position 2-3: illegal multibyte sequence


UnicodeDecodeError: 'gbk' codec can't decode bytes in position 2-3: illegal multibyte sequence

失败原因:原文件中文是UTF-8编码,现在用gbk解码则会报错,编码和解码方法不一致所致;

解决办法:先确认原文件数据的编码格式,然后再确认现在对文件数据的解码格式,需确保编码格式和解码格式一致

lines[i].decode('utf-8').encode('gbk')或者unicode(lines[i],'utf-8')均可以。

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM