一、Beautiful Soup庫遇到的問題
1.ImportError: No module named BeautifulSoup
當你成功安裝BeautifulSoup 4庫后,“from BeautifulSoup import BeautifulSoup”可能會遇到該錯誤。


2.TypeError: an integer is required
當你使用“print soup.title.string”獲取title的值時,可能會遇到該錯誤。如下:
print unicode(soup.title.string)
print str(soup.title.string)
下載地址:https://www.crummy.com/software/BeautifulSoup/bs4/download/
下載完成后解壓到python安裝包的地方,存放在Beautifulsoup.**文件下
win+R ————cmd cd (第 2 步放置安裝包的位置)C:\Python36\beautifulsoup4-4.6.0
安裝:python steup.py install
二. 安裝及介紹Beautiful Soup庫
安裝beautiful soup庫

#安裝 pip install beautifulsoup4 #檢查 from bs4 import Beautiful Soup #安裝 lxml pip install lxml
別的就不多說了
pip install beautifulsoup4
安裝完成后
from bs4 import BeautifulSoup
進行導入模塊,如果運行沒有問題,那么我們就是成功了--------如果是報的‘import name HTMLParseError’,就說明我們的python版本與beautiful soup4的支持版本不符,那么我要更新運行beautiful soup,或者直接下載最新的(才腦殼痛哦)
pip3 install --upgrade beautifulsoup4
更新完成后,那么我們就可以使用 bs4 了,如果還是報錯 (那么我就進入他老巢————文件夾看看)打開 finder ,前往文件夾:
/usr/local/lib/python3.6/site-packages
在這個文件夾里找一找,看有沒有兩個beautifuls4的文件,如果有,刪掉那個舊版本的,我的是不知道什么原因,site-packages里多了個 ‘‘beautifulsoup4-4.1.0-py3.6.egg-info’’文件,刪除掉就好了。
beautifulsoup4安裝完成之后,還需要一個叫 lxml 的依賴庫:
pip3 install lxml
ok,完成,我的也就是到這里為止了,可能還有更好的操作方法也說不定的哈,小弟課多也就再花功夫在研究咯0.....0
Beautiful Soup提供一些簡單的、python式的函數用來處理導航、搜索、修改分析樹等功能。它是一個工具箱,通過解析文檔為用戶提供需要抓取的數據,因為簡單,所以不需要多少代碼就可以寫出一個完整的應用程序。
Beautiful Soup自動將輸入文檔轉換為Unicode編碼,輸出文檔轉換為utf-8編碼。你不需要考慮編碼方式,除非文檔沒有指定一個編碼方式,這時,Beautiful Soup就不能自動識別編碼方式了。然后,你僅僅需要說明一下原始編碼方式就可以了。
Beautiful Soup已成為和lxml、html6lib一樣出色的python解釋器,為用戶靈活地提供不同的解析策略或強勁的速度
具體的介紹我們還是參考官方文檔吧:
http://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html