Xpath编码问题解决

本文转载自查看原文 2020-01-02 23:05 942

使用Xpath获取属性时，出现乱码问题，解决办法找了好多，终于解决，特将办法贴在这，供大家尝试

不要直接简单的将爬取的网页设置为utf-8,

先通过print(r.encoding)输出看看爬取的是什么编码，每个网页采用的编码不同，

后通过标红线的代码可解决问题

selector_new = etree.HTML(html.text)
是将HTML转化为文本/html 格式
selector_new = etree.HTML(html.content)
是将HTML转化为二进制/html 格式

我是通过以下链接博客解决的：

https://blog.csdn.net/hyg55555/article/details/85246353

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 cmder的使用和编码问题解决 utf8编码和中文不能解码问题解决 Python显示中文时间编码问题解决 sass编译时候的编码问题解决办法！ Apache以及PHP的默认编码问题解决（详解） pandas用read_csv时编码问题解决文本编码与解码问题解决方案关于python+selenium使用xpath定位元素后无法点击问题解决 xpath无法获取值、返回值为[]或者{}的问题解决若依问题解决（一）