python3默認是utf8的,爬取gbk網頁的時候會出現亂碼
解決辦法
test.encoding="gbk" test.text
text不轉換會出現錯誤,python3字符集不支持轉碼
第二種方法
test.content.decode("gbk")
decode的作用是將其他編碼的字符串轉換成unicode編碼,如str1.decode('gb2312'),表示將gb2312編碼的字符串str1轉換成unicode編碼。 解碼
encode的作用是將unicode編碼轉換成其他編碼的字符串,如str2.encode('gb2312'),表示將unicode編碼的字符串str2轉換成gb2312編碼。 編碼