Python文件讀取編碼錯誤問題解決之(PyCharm開發工具默認設置的坑。。。)


剛接觸Python學習,正准備做個爬蟲的例子,誰知道代碼一開始就遇到了一個大坑,狂汗啊。

問題是這樣的:我通過代碼爬取了博客園首頁的HTML代碼並存入到blog.txt文件當中,然后准備讀取出來之后進行分析,可就在讀取文件的這一步出現了問題。

執行讀取代碼的時候程序總是會拋一個叫 “UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position 117274: illegal multibyte sequence”的異常。

剛開始以為是簡單的編碼問題,又是在代碼中設置編碼格式,又是百度谷歌的。可是,沒找到一個靠譜的解決方案,問題依然存在。

折騰了好幾天實在是沒辦法了,后來突然想到會不會和IDE的設置有關系(我使用的IDE是PyCharm)。呵呵,折騰一番還真的解決了。

 

錯誤截圖:

 

步驟一:打開IDE的設置選項

 

步驟二 查看編碼設置,並將所有設置都設置為UTF-8

 

步驟三 編碼設置完后重新執行代碼,問題解決

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM