UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xd5 in position 0: invalid continuation byte
出現原因:CSV文件不是UTF-8進行編碼,而是用gbk進行編碼的。jupyter-notebook使用的Python解釋器的系統編碼默認使用UTF-8.
解決方式有兩種;
第一種:
1.找到使用的csv文件--->鼠標右鍵--->打開方式---->選擇記事本
2.打開文件選擇“文件”----->"另存為“,我們可以看到默認編碼是:ANSI,選擇UTF-8重新保存一份,再使用pd.read_csv()打開就不會保存了
第二種:
使用pd.read()讀取CSV文件時,進行編碼
pd.read(filename,encoding='gbk')
比如:
with open('E:/***.csv', 'r', encoding="gbk") as f:
————————————————
版權聲明:本文為CSDN博主「砍柴樵夫」的原創文章,遵循 CC 4.0 BY-SA 版權協議,轉載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/weixin_44758458/article/details/89220989