讀取csv文件（含中文）報錯解決方法

本文轉載自查看原文 2019-07-29 16:24 1236 selenium

在學習讀取csv文件讀取時，發現一個問題：網上學習的代碼比比皆是，可是舉例中csv文件都不存在中文(好多說不支持中文)，所以在嘗試含有中文讀取時（就是不死心，哈哈），發現了幾個報錯，在度娘的幫助下已順利解決。下面就總結下解決過程。

1、csv文件：

2、在紅黑聯盟中看到了讀取csv文件的介紹，於是寫了第一次代碼：

運行結果：

從報錯中可以看出csv文件並非二進制文件，只是一個文本文件

3、於是，修改成以下代碼

運行結果：

報錯提示“utf-8”編解碼器無法解碼位置22中的字節0xc7，說明該csv文件未使用utf-8編碼，因此無法使用utf-8編碼器打開它。

4、於是，將文件另存，選擇保存類型為：CSV UTF-8（逗號分隔）

再運行代碼，結果如下：

從結果可以看出，中文已正常顯示，但是第1行第1列中多顯示了‘\ufeff’這個東東。

然后就了解了utf-8與utf-8-sig兩種編碼格式的區別:

UTF-8以字節為編碼單元，它的字節順序在所有系統中都是一樣的，沒有字節序的問題，也因此它實際上並不需要BOM(“ByteOrder Mark”)。但是UTF-8 with BOM即utf-8-sig需要提供BOM。

緊接着，將代碼改成如下樣子：

運行結果：

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 scrapy抓中文，保存csv文件亂碼解決方法獲取csv文件編碼，解決csv讀取中文亂碼問題用c#讀取文件內容中文是亂碼的解決方法： arcgis for android 讀取shp文件中文亂碼解決方法 java讀取中文亂碼解決方法 php 生成讀取csv文件並解決中文亂碼 pandas讀取csv常見錯誤及解決方法 Python 中文注釋報錯解決方法 PHP導出CSV文件出現亂碼的解決方法 php導入csv文件碰到亂碼問題的解決方法