'utf-8' codec can't decode byte 0xd0 in position 0問題


今天利用pd.read_csv(url)從網絡上讀取數據時出現了如下錯誤:

'utf-8' codec can't decode byte 0xd0 in position 0

問題原因:網絡上的這個文件不是 UTF8 編碼的,而系統默認采用 UTF8 解碼,用UTF8編解碼器無法解碼該文件。

但是如果把該文件的編碼方式改為UTF8,文件又變成亂碼格式,如下:

 

 

解決辦法:

新建一個txt文件,把內容復制進去,點擊另存為,在編碼的地方選擇UTF-8,再用pd.read_csv(),完美解決

 

 

備注:sublime text3界面默認是不顯示文件編碼方式的,如果要想在右下角顯示文件編碼方式,可以

preference --> settings --> 加入如下代碼:

"show_encoding": true, "show_line_endings": true,

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM