報錯分析:
我們檢查代碼沒有任何問題,但報錯顯示:開始和結束標記不匹配。
html:因為html是超文本標記語言,代碼不規范也能解析。
python:python是編程語言,代碼不規范則解析不了。
解決方案:
我們只要給python指定解析器,他是不是能解析出網頁呢?
parser = etree.HTMLParser(encoding="utf-8") #parser:解析器。文件名+網頁類型+解析器(指定編碼)
把parser解析器放到tree = etree.parse("b.html")里面:tree = etree.parse("b.html", parser=parser)
運行:
指定類型解碼:etree.tostring(tree, encoding="utf-8").decode("utf-8")

:這是換行符,這個沒有影響