python3 requests爬取gbk时候遇到编码的坑


python3默认是utf8的,爬取gbk网页的时候会出现乱码 

解决办法 

test.encoding="gbk"
test.text

text不转换会出现错误,python3字符集不支持转码

第二种方法

test.content.decode("gbk")

decode的作用是将其他编码的字符串转换成unicode编码,如str1.decode('gb2312'),表示将gb2312编码的字符串str1转换成unicode编码。 解码

encode的作用是将unicode编码转换成其他编码的字符串,如str2.encode('gb2312'),表示将unicode编码的字符串str2转换成gb2312编码。 编码


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM