1. 什么是beatifulsoup?
beatifulsoup官網http://www.crummy.com/software/BeautifulSoup/ BeatifulSoup是用Python寫的一個HTML/XML的解析器,它可以很好的處理不規范標記並生成剖析樹(parse tree)。 它提供簡單又常用的導航(navigating),搜索以及修改剖析樹的操作。它可以大大節省你的編程時間。
2. 如何安裝beatifulsoup?
從beatifulsoup的官網上找到下載鏈接,打到最新的新的版本下載到本地,然后安裝。
$wget http://www.crummy.com/software/BeautifulSoup/bs4/download/4.3/beautifulsoup4-4.3.2.tar.gz $tar zxvf beautifulsoup4-4.3.2.tar.gz $cd beautifulsoup4-4.3.2 $python setup.py install $python >> from bs4 import BeautifulSoup
如果沒有報錯,即安裝成功。
3. 如何使用
beautifulsoup的官網上有文檔。http://www.crummy.com/software/BeautifulSoup/bs4/doc/ 居然不家中文版!http://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html