安裝beautifulsoup庫時遇到麻煩


一、Beautiful Soup庫遇到的問題

       1.ImportError: No module named BeautifulSoup       

當你成功安裝BeautifulSoup 4庫后,“from BeautifulSoup import BeautifulSoup”可能會遇到該錯誤。


        其中的原因是BeautifulSoup 4庫改名為bs4,需要使用“from bs4 import BeautifulSoup”導入。

        2.TypeError: an integer is required

        當你使用“print soup.title.string”獲取title的值時,可能會遇到該錯誤。如下:

        它應該是IDLE的BUG,當使用命令行Command沒有任何錯誤。參考: stackoverflow。同時可以通過下面的代碼解決該問題:
        print unicode(soup.title.string)
        print str(soup.title.string)

下載地址:https://www.crummy.com/software/BeautifulSoup/bs4/download/

下載完成后解壓到python安裝包的地方,存放在Beautifulsoup.**文件下

 

win+R  ————cmd  cd (第 2 步放置安裝包的位置)C:\Python36\beautifulsoup4-4.6.0

安裝:python steup.py install

二. 安裝及介紹Beautiful Soup庫

安裝beautiful soup庫

#安裝
pip install beautifulsoup4
#檢查
from bs4 import Beautiful Soup
#安裝 lxml
pip install lxml
捷徑

別的就不多說了

pip install beautifulsoup4

安裝完成后

from bs4 import BeautifulSoup

進行導入模塊,如果運行沒有問題,那么我們就是成功了--------如果是報的‘import name HTMLParseError’,就說明我們的python版本與beautiful soup4的支持版本不符,那么我要更新運行beautiful soup,或者直接下載最新的(才腦殼痛哦)

pip3 install --upgrade beautifulsoup4

更新完成后,那么我們就可以使用 bs4 了,如果還是報錯 (那么我就進入他老巢————文件夾看看)打開 finder ,前往文件夾:

/usr/local/lib/python3.6/site-packages

在這個文件夾里找一找,看有沒有兩個beautifuls4的文件,如果有,刪掉那個舊版本的,我的是不知道什么原因,site-packages里多了個 ‘‘beautifulsoup4-4.1.0-py3.6.egg-info’’文件,刪除掉就好了。

beautifulsoup4安裝完成之后,還需要一個叫 lxml 的依賴庫:

pip3 install lxml

ok,完成,我的也就是到這里為止了,可能還有更好的操作方法也說不定的哈,小弟課多也就再花功夫在研究咯0.....0

Beautiful Soup提供一些簡單的、python式的函數用來處理導航、搜索、修改分析樹等功能。它是一個工具箱,通過解析文檔為用戶提供需要抓取的數據,因為簡單,所以不需要多少代碼就可以寫出一個完整的應用程序。

Beautiful Soup自動將輸入文檔轉換為Unicode編碼,輸出文檔轉換為utf-8編碼。你不需要考慮編碼方式,除非文檔沒有指定一個編碼方式,這時,Beautiful Soup就不能自動識別編碼方式了。然后,你僅僅需要說明一下原始編碼方式就可以了。

Beautiful Soup已成為和lxml、html6lib一樣出色的python解釋器,為用戶靈活地提供不同的解析策略或強勁的速度

具體的介紹我們還是參考官方文檔吧:
 http://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM