安裝robobrowser
注意:這里假設你知道如何使用pip安裝python的庫的知識,如果你不了解這一塊的話,點這里獲取幫助。
強烈推薦使用pip安裝。
pip install robobrowser -i http://pypi.douban.com/simple/
這里用上了豆瓣源,原因你懂得。
快速開始
新建1個start.py文本文件,然后敲入下面的代碼
1 import re 2 from robobrowser import RoboBrowser 3 4 b = RoboBrowser(history=True) 5 b.open('http://itest.info/courses/2') 6 7 title = b.select('.headline h2') 8 print title[0].text 9 10 infos = b.select('h4') 11 12 for info in infos: 13 print info.text
在命令行里運行 python start.py ,然后看一下結果,如果報錯請自行耐心分析原因。
查看文檔
robobrowser自帶一點點文檔,聊勝於無,湊合看吧。
在命令行里運行
python -m pydoc -p 1234
如果運行成功的話,就從瀏覽器中訪問http://localhost:1234/robobrowser.html。主要看一下browser這個類就好了。
相關知識
Beautiful Soup將讓你受益匪淺,強烈建議閱讀。
文本版權歸乙醇所有,歡迎轉載,但請標明出處。
下一節:基於robobrowser的簡單的爬蟲