因為做網頁爬蟲,需要用到一個爬新聞的BeautifulSoup 的包,然后再關網上下的是whl包,第一次裝,雖然花了點時間,最后還是裝上去了,記錄一下,方便下次。
先發一下官方文檔地址。http://www.crummy.com/software/BeautifulSoup/bs4/doc/
建議有時間可以看一下Python包的文檔。
Beautiful Soup 相比其他的html解析有個非常重要的優勢。html會被拆解為對象處理。全篇轉化為字典和數組。
相比正則解析的爬蟲,省略了學習正則的高成本。
相比xpath爬蟲的解析,同樣節約學習時間成本。雖然xpath已經簡單點了。(爬蟲框架Scrapy就是使用xpath)
先在網頁上下載自己python版本對應的包。https://pypi.python.org/pypi/beautifulsoup4/#downloads

1.在安裝pip前,請確認win系統中已經安裝好了python,和easy_install工具,如果系統安裝成功,easy_install在目錄C:\Python27\Scripts 下面,確認截圖如下:

2.進入命令行,然后把目錄切換到python的安裝目錄下的Script文件夾下,運行 easy_inatall pip。

3.pip安裝成功后,在cmd下執行pip,將會有如下提示。pip install 文件地址。安裝成功后就可以看到pycharm里面已經有之前安裝的包了



