python 3.5 解決csv 讀入中的'utf-8' codec can't decode辦法


UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xd0 in position 0: invalid continuation byte
原因:
excel和csv中的中文儲存格式是GBK,而Python對輸入源的格式讀取默認為‘utf-8’,所以導致帶中文的文件讀不進來。
------------------------------------------------------------------------------------------------------------------------------------------
解決方法1(最佳):
直接在讀取時聲明csv的編碼方式為‘gbk’
data=pd.read_csv('data.csv',encoding='gbk')

解決方法2:
1.將數據源的編碼方式改為‘utf-8’
##參考https://blog.csdn.net/moledyzhang/article/details/78978312

2.找到csv文件–》右鍵–》打開方式–》記事本

3.打開記事本之后,選擇頭部菜單的“文件–》另存為”,可以看到文件的默認編碼格式為ANSI

4.選擇編碼下拉框,選擇需要的編碼格式UTF8,重新保存即可
最后重新運行代碼,問題得到解決
原文:https://blog.csdn.net/lucindawuyi/article/details/80418277 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM