利用pandas中的to_csv模塊保存數據，打開csv文件時出現亂碼的解決方法

本文轉載自查看原文 2018-03-03 20:53 1903

最近嘗試獲取IEEE上的論文，實現批量獲取論文的題目、作者、出版雜志、引用次數等內容，並將檢索的數據保存為csv文件。在這個過程中，發現使用to_csv默認的"utf-8"編碼類型進行讀寫文件的時候，部分作者的名字出現亂碼情況，如下圖所示。

“Hana Dobšíček Trefná” 顯示成為了“Hana Dob擰鉚膷ek Trefn謾”，出現這樣的情況，是由於編碼的問題所引起的，因此主要是在encoding上找解決方案，從網上查到unicode編碼有utf-8、utf-16和utf-32三種形式。

情況三：設置encoding="utf-16", sep="\t",“Hana Dobšíček Trefná”顯示正常，能正常分列，使用read_csv可以正常讀取。

情況四：設置encoding="utf-32", sep="\t",“Hana Dobšíček Trefná”顯示正常，能正常分列，使用read_csv無法正常讀取。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 使用pandas中的to_csv將數據寫入csv格式的文件 Excel打開CSV時出現亂碼怎么解決解決python中 .to_csv() 的亂碼問題 scrapy抓中文，保存csv文件亂碼解決方法 EXCEL打開CSV文件亂碼的解決方法 PHP導出CSV文件出現亂碼的解決方法 csv文件中出現亂碼的解決方法 python3 庫pandas寫入csv格式文件出現中文亂碼問題解決方法 pandas中DataFrame對象to_csv()方法中的encoding參數 pandas中DataFrame對象to_csv()方法中的encoding參數