嘗試給公司的網站寫每日例行檢查的腳本時,不需要去打開瀏覽器,這是就用到HTMLUNIT的使用
HTMLUNIT是基於Selenium服務端的,所以需要selenium-server-standalone-XXX.jar
1、下載安裝java ,為了運行jar包
2、下載selenium-server-standalone-XXX.jar ,這里特別要注意版本,要跟自己的selenium版本匹配
查看自己已經安裝的包的方法,cmd命令進入安裝Python的目錄下的Scripts
輸入 pip list即可查看所有已經安裝的包的版本號
3、以上兩步完成后,cmd進入到selenium-server-standalone-XXX.jar 的安裝目錄,
cmd命令輸入 java -jar selenium-server-standalone-xxx.jar,代理服務器就跑起來啦
PS:如果無法啟動,可能是端口被占用了,可以下載tcpview查看所有端口
4、最后一步就是測試一下HTMLUNIT能否正常使用了
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities from selenium import webdriver htmlunit = webdriver.Remote(desired_capabilities=DesiredCapabilities.HTMLUNIT) htmlunit.get("http://www.baidu.com")
print htmlunit.title
輸出結果:
C:\Python27\python.exe F:/soft_Test/python/code/HTMLUnit_Test.py 百度一下,你就知道 Process finished with exit code 0