盤點CSV文件在Excel中打開后亂碼問題的兩種處理方法


大家好,我是Python進階者。前幾天給大家分享了一些亂碼問題的文章,閱讀量還不錯,感興趣的小伙伴可以前往:盤點3種Python網絡爬蟲過程中的中文亂碼的處理方法UnicodeEncodeError: 'gbk' codec can't encode character解決方法,今天基於粉絲提問,給大家介紹CSV文件在Excel中打開后亂碼問題的兩種處理方法,希望對大家的學習有所幫助。

前言

前幾天有個叫【RSL】的粉絲在Python交流群里問了一道關於CSV文件在Excel中打開后亂碼的問題,如下圖所示。

在Excel中直接打開csv文件,如下圖所示:

群中提問:

看上去確實頭大,對於爬蟲初學者來說,這個亂碼擺在自己面前,猶如攔路虎一般難頂。不過別慌,小編在這里給大家整理了兩種方法,專門用於針對CSV文件亂碼的,希望大家在后面再次遇到這樣亂碼的問題,在此處可以得到靈感!

一、思路

其實解決問題的關鍵點就是在於一點,就是編碼的轉換。這里例舉兩種方法,肯定還有其他的方法的,也歡迎大家在評論區諫言。

二、解決方案

方法一:notepad++打開    因為csv文件本質上也是文本文件,本身用notepad++打開csv文件是可以直接打開,不會亂碼的。如果在網絡爬蟲的時候,指定了存儲格式為utf-8編碼,那么該csv文件用notepad++打開是沒啥問題的。

f = open('filename.csv', mode='a', encoding="utf-8")
csvwriter = csv.writer(f)

如下圖所示:

因為我源文件本身就是韓語和日本語,所以看到的就是這個了,上圖絕不是亂碼哈,別誤導了大家,嘻嘻!

方法二:Excel轉換    這個方法稍微復雜一些,但是比較好理解,對於初學者來說,還是比較好接受的,直接在Excel中進行操作,步驟如下。
1)打開一個Excel文件,之后依次點擊“數據”-->“從文本/CSV”,如下圖所示。

2)之后選擇需要加載的CSV文件,然后會自動彈出下圖

從這里看的是原始文件,確實是亂碼的存在,接下來需要稍微設置下就可以了。

3)文件原始格式設置為“無”或者你的原始編碼“UTF-8”;分隔符默認是逗號;數據類型檢測選擇基於整個數據集,最后選擇右下方的加載,如下圖所示。

4)之后稍等片刻,CSV文件就會自動加載到Excel,如下圖所示。

因為我源文件本身就是韓語和日本語,所以看到的就是這個了。

5)在Excel中的顯示,如下圖所示:

看上去還是比較清爽的,如此一來,中文亂碼的問題就迎刃而解了。之后你就可以進行進一步的轉存為標准的Excel文件或者進行數據處理都可以。

三、總結

我是Python進階者。本文基於粉絲提問,針對CSV文件在Excel中打開后亂碼問題,給出了兩種亂碼解決方法,順利幫助粉絲解決了問題。雖然文中例舉了兩種方法,但是小編相信肯定還有其他的方法的,也歡迎大家在評論區諫言。

圖片

小伙伴們,快快用實踐一下吧!如果在學習過程中,有遇到任何問題,歡迎加我好友,我拉你進Python學習交流群共同探討學習。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM