解決scrapy中文亂碼的案例


 

scrapy一開始嘗試發現問題

{18EFD93A-A035-4D62-B8B5-BEA093E9EF99}_20200630172602.jpg

抓包的結果

{5618B7D0-ACE0-40A9-9CAD-31EB44144F73}_20200630172349.jpg發現這個默認的應該不是utf-8

寫demo測試一下看看是什么編碼格式

{1E467B95-237B-4AD4-96E4-CAF7988A2F83}_20200630172441.jpg得到的結果為gbk編碼

於是從網上找了一些scrapy的解決方案

在setting文件中設置:FEED_EXPORT_ENCODING = 'utf-8' 嘗試了一下,發現還是不行

又找了一些資料然后用scrapy shell執行測試

發現用reponse.body.decode('gbk')可以用,但是需要注意這個是直接返回的結果,需要一個參數來接收

最終成功是這樣的

{11BE5259-00E4-4F7A-8ED1-CA102E218282}_20200630172640.jpg


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM