UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc0 in position 344: invalid start byte報錯解決方案


一、問題描述

使用python爬蟲爬取某網頁的內容時,代碼中因為這行代碼報錯:cont = rep.read().decode()
 
二、出現原因
你請求獲取到的內容不是utf-8編碼,如果是utf-8編碼可以在decode()中不寫,默認utf-8
 
三、解決方案
 
1、首先查看你要爬取網頁的內容的編碼格式,如下圖
 
2、如果非utf-8編碼,就需要在decode()函數中標明,比如我應該寫為:cont = rep.read().decode('gb2312'),問題解決。
 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM