在jupyter或者python中讀取CSV文件時出現‘utf-8’ codec can’t decode byte 0xd5 in position 0: invalid continuation byte解決方法


UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xd5 in position 0: invalid continuation byte

出現原因:CSV文件不是UTF-8進行編碼,而是用gbk進行編碼的。jupyter-notebook使用的Python解釋器的系統編碼默認使用UTF-8.

解決方式有兩種;

第一種:

1.找到使用的csv文件--->鼠標右鍵--->打開方式---->選擇記事本

2.打開文件選擇“文件”----->"另存為“,我們可以看到默認編碼是:ANSI,選擇UTF-8重新保存一份,再使用pd.read_csv()打開就不會保存了 

 

 

 

 

 

 

第二種:

使用pd.read()讀取CSV文件時,進行編碼

pd.read(filename,encoding='gbk')

比如:

   with open('E:/***.csv', 'r', encoding="gbk") as f:


————————————————
版權聲明:本文為CSDN博主「砍柴樵夫」的原創文章,遵循 CC 4.0 BY-SA 版權協議,轉載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/weixin_44758458/article/details/89220989


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM