Xpath編碼問題解決

本文轉載自查看原文 2020-01-02 23:05 942

使用Xpath獲取屬性時，出現亂碼問題，解決辦法找了好多，終於解決，特將辦法貼在這，供大家嘗試

不要直接簡單的將爬取的網頁設置為utf-8,

先通過print(r.encoding)輸出看看爬取的是什么編碼，每個網頁采用的編碼不同，

后通過標紅線的代碼可解決問題

selector_new = etree.HTML(html.text)
是將HTML轉化為文本/html 格式
selector_new = etree.HTML(html.content)
是將HTML轉化為二進制/html 格式

我是通過以下鏈接博客解決的：

https://blog.csdn.net/hyg55555/article/details/85246353

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 cmder的使用和編碼問題解決若依問題解決（一） NoClassDefFoundError問題解決 mysql執行sql導入數據及結構報編碼錯誤問題解決關於Laravel中使用response()方法調用json()返回數據unicode編碼轉換的問題解決 git status中文文件名編碼問題解決 Tomcat 中文亂碼設置UTF-8編碼問題解決辦法 Python2和Python3中的字符串編碼問題解決關於SpringMVC中text/plain的編碼導致的亂碼問題解決方法 GBK編碼網站使用AJAX接收數據中文顯示亂碼問題解決