在jupyter或者python中讀取CSV文件時出現‘utf-8’ codec can’t decode byte 0xd5 in position 0: invalid continuation byte解決方法

本文轉載自查看原文 2020-03-25 11:24 1486 python

UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xd5 in position 0: invalid continuation byte

出現原因：CSV文件不是UTF-8進行編碼，而是用gbk進行編碼的。jupyter-notebook使用的Python解釋器的系統編碼默認使用UTF-8.

解決方式有兩種;

第一種：

1.找到使用的csv文件--->鼠標右鍵--->打開方式---->選擇記事本

2.打開文件選擇“文件”----->"另存為“，我們可以看到默認編碼是：ANSI，選擇UTF-8重新保存一份，再使用pd.read_csv()打開就不會保存了

第二種：

使用pd.read()讀取CSV文件時，進行編碼

pd.read(filename,encoding='gbk')

比如：

　　　with open('E:/***.csv', 'r', encoding="gbk") as f:

————————————————
版權聲明：本文為CSDN博主「砍柴樵夫」的原創文章，遵循 CC 4.0 BY-SA 版權協議，轉載請附上原文出處鏈接及本聲明。
原文鏈接：https://blog.csdn.net/weixin_44758458/article/details/89220989

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。