Beautiful Soup常見的解析器

本文轉載自查看原文 2017-07-23 10:36 2542 解析-BeautifulSoup

Beautiful Soup支持Python標准庫中的HTML解析器,還支持一些第三方的解析器，如果我們不安裝它，則 Python 會使用 Python默認的解析器，lxml 解析器更加強大，速度更快，推薦安裝。

解析器	使用方法	優勢	劣勢
Python標准庫	BeautifulSoup(markup, “html.parser”)	Python的內置標准庫執行速度適中文檔容錯能力強	Python 2.7.3 or 3.2.2)前的版本中文檔容錯能力差
lxml HTML 解析器	BeautifulSoup(markup, “lxml”)	速度快文檔容錯能力強	需要安裝C語言庫
lxml XML 解析器	BeautifulSoup(markup, [“lxml”, “xml”])BeautifulSoup(markup, “xml”)	速度快唯一支持XML的解析器	需要安裝C語言庫
html5lib	BeautifulSoup(markup, “html5lib”)	最好的容錯性以瀏覽器的方式解析文檔生成HTML5格式的文檔	速度慢

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Beautiful Soup 解析html表格示例 Requests爬蟲包及解析工具 xpath、正則、Beautiful Soup python之Beautiful Soup的基本用法爬蟲---Beautiful Soup 初始（最全）Xpath、Beautiful Soup、Pyquery三種解析庫解析html 功能概括 Python爬蟲利器：Beautiful Soup Python之Beautiful Soup 4使用實例 Beautiful Soup 如何獲取到href 語法解析器！ python beautiful soup庫的超詳細用法