今天利用pd.read_csv(url)從網絡上讀取數據時出現了如下錯誤:
'utf-8' codec can't decode byte 0xd0 in position 0
問題原因:網絡上的這個文件不是 UTF8 編碼的,而系統默認采用 UTF8 解碼,用UTF8編解碼器無法解碼該文件。
但是如果把該文件的編碼方式改為UTF8,文件又變成亂碼格式,如下:
解決辦法:
新建一個txt文件,把內容復制進去,點擊另存為,在編碼的地方選擇UTF-8,再用pd.read_csv(),完美解決
備注:sublime text3界面默認是不顯示文件編碼方式的,如果要想在右下角顯示文件編碼方式,可以
preference --> settings --> 加入如下代碼:
"show_encoding": true, "show_line_endings": true,