scrapy使用response.body时编码问题


scrapy使用response.body时编码问题

 

摘要:scrapy使用response.body时编码问题。如果在使用responses.body获取数据时,需要将其编码转换成unicode,即如下处理:

response.body返回的结果是byte字节串,其编码是网页的原编码;

如果在使用responses.body获取数据时,需要将其编码转换成unicode,即如下处理:

 

body = response.body.decode('gbk') #假设网页编码是gbk.

 

body = response.body.decode(response.encoding) #即可将其转化成默认的编码

 

这样输出来的内容才正确。也可以直接用response.text这样可以直接是字符串了。

 

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM