python 3.5 解決csv 讀入中的'utf-8' codec can't decode辦法

本文轉載自查看原文 2018-10-19 16:16 2244 python

UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xd0 in position 0: invalid continuation byte
原因：
excel和csv中的中文儲存格式是GBK，而Python對輸入源的格式讀取默認為‘utf-8’，所以導致帶中文的文件讀不進來。
------------------------------------------------------------------------------------------------------------------------------------------
解決方法1（最佳）：
直接在讀取時聲明csv的編碼方式為‘gbk’
data=pd.read_csv('data.csv',encoding='gbk')

解決方法2：
1.將數據源的編碼方式改為‘utf-8’
##參考https://blog.csdn.net/moledyzhang/article/details/78978312

2.找到csv文件–》右鍵–》打開方式–》記事本

3.打開記事本之后，選擇頭部菜單的“文件–》另存為”，可以看到文件的默認編碼格式為ANSI

4.選擇編碼下拉框，選擇需要的編碼格式UTF8，重新保存即可
最后重新運行代碼，問題得到解決
原文：https://blog.csdn.net/lucindawuyi/article/details/80418277

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。