BeautifulSoup庫

一.BeautifulSoup庫的下載以及使用

pip3 install beautifulsoup4

improt bs4

解析器	使用方法	優勢	劣勢
bs4的HTML解析器	BeautifulSoup(mk,'html.parser')	Python 的內置標准庫執行速度適中文檔容錯能力強	Python 2.7.3 or 3.2.2)前的版本中文檔容錯能力差
lxml的HTML解析器	BeautifulSoup(mk,'lxml')	速度快文檔容錯能力強	需要安裝C語言庫
lxml的XML解析器	BeautifulSoup(mk,'xml')	速度快唯一支持XML的解析器	需要安裝C語言庫
html5lib解析器	BeautifulSoup(mk,'html5lib')	最好的容錯性以瀏覽器的方式解析文檔生成HTML5格式的文檔	速度慢

條件 :

注意:如果是html的父標簽就是他自己,soup本身也是種特殊的標簽的他的父標簽是空

注意:必須在同一個父節點下才有平行關系,平行遍歷獲得的對象不一定是標簽,也可能是文本,如果上下沒來就為空

解析后的頁面

prettify():會把解析的網頁加上\n的文本文檔,能使它打印變得更加好看

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Python常用的幾個解析庫的學習整理。BeautifulSoup。 BeautifulSoup4 庫的基本使用 BeautifulSoup庫的使用 BeautifulSoup庫的安裝與使用 03 解析庫beautifulsoup python BeautifulSoup庫詳解爬蟲解析庫——BeautifulSoup 爬蟲（四）：BeautifulSoup庫的使用 python BeautifulSoup庫用法總結 BeautifulSoup解析庫的介紹和使用