lxml.etree.XMLSyntaxError: Opening and ending tag mismatch: meta line 4 and head, line 6, column 12 報錯分析與解決方案


報錯分析:

我們檢查代碼沒有任何問題,但報錯顯示:開始和結束標記不匹配。

html:因為html是超文本標記語言,代碼不規范也能解析。

python:python是編程語言,代碼不規范則解析不了。

 

 

 

解決方案:

我們只要給python指定解析器,他是不是能解析出網頁呢?

parser = etree.HTMLParser(encoding="utf-8") #parser:解析器。文件名+網頁類型+解析器(指定編碼)
把parser解析器放到tree = etree.parse("b.html")里面:tree = etree.parse("b.html", parser=parser)

運行:

 

 

指定類型解碼:etree.tostring(tree, encoding="utf-8").decode("utf-8")
&#13:這是換行符,這個沒有影響

 

 

 



 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM