python爬蟲之Phantomjs安裝和使用


phantomjs:

  PhantomJS是一個無界面的,可腳本編程的WebKit瀏覽器引擎。它原生支持多種web 標准:DOM 操作,CSS選擇器,JSON,Canvas 以及SVG。

phantomjs:

  1、無UI界面的網站測試

  2、屏幕快照

  3、頁面操作自動化

 

官方文檔:http://phantomjs.org/api/command-line.html

官方下載:http://phantomjs.org/download

1、下載完成后放到自己喜歡的一個位置,然后進入bin文件夾,然后把這個路徑添加到環境變量里面。

 

 使用:

 學習過Selenium的同學都知道webdriver.chrome(),使用谷歌瀏覽器打開爬取頁面(或者是測試頁面),如果是.PhantomJS()的話就直接省去了系統打開頁面的步驟。

browser = webdriver.Chrome()
browser = webdriver.PhantomJS(service_args=SERVICE_ARGS)

 service_args= 這里寫的是參數,參數如下:

  1、不加載圖片

  2、啟用硬盤緩存

SERVICE_ARGS = ['--load-images=false','--disk-cache=true']

  

  


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM