一、問題描述
使用python爬蟲爬取某網頁的內容時,代碼中因為這行代碼報錯:cont = rep.read().decode()
二、出現原因
你請求獲取到的內容不是utf-8編碼,如果是utf-8編碼可以在decode()中不寫,默認utf-8
三、解決方案
1、首先查看你要爬取網頁的內容的編碼格式,如下圖
2、如果非utf-8編碼,就需要在decode()函數中標明,比如我應該寫為:cont = rep.read().decode('gb2312'),問題解決。