什么是selenium?
- Selenium是一個用於Web應用程序測試的工具。
- Selenium 測試直接運行在瀏覽器中,就像真正的用戶在操作一樣。
- 支持通過各種driver(FirfoxDriver,IternetExplorerDriver,OperaDriver,ChromeDriver)驅動真實瀏覽器完成測試。
- selenium也是支持無界面瀏覽器操作的。
為什么使用selenium?
- 模擬瀏覽器功能,自動執行網頁中的js代碼,實現動態加載
如何安裝selenium?
- 操作谷歌瀏覽器驅動下載地址, http://chromedriver.storage.googleapis.com/index.html
- 谷歌驅動和谷歌瀏覽器版本之間的映射表, http://blog.csdn.net/huilan_same/article/details/51896672
- 查看谷歌瀏覽器版本, 谷歌瀏覽器右上角‐‐>幫助‐‐>關於
- pip install selenium
selenium的使用步驟?
導入:from selenium import webdriver
創建谷歌瀏覽器操作對象:
path = 谷歌瀏覽器驅動文件路徑
browser = webdriver.Chrome(path)
訪問網址
url = 要訪問的網址
browser.get(url)
查看瀏覽器版本
下載chrome的對應版本chromedriver.exe
使用國內源地址http://npm.taobao.org/mirrors/chromedriver/
下載好解壓到文件夾,隨意路徑即可
瀏覽器不是默認安裝路徑。調用Chrome瀏覽器時,經常會遇到以下報錯cannot find chrome binary(找不到chrome文件)
需要添加瀏覽器到環境變量中
右擊桌面chrom圖標—>打開‘文件所在位置’—>復制路徑—>添加到系統變量path中
# (1) 導入selenium
from selenium import webdriver # 指定chromedriver.exe驅動絕對路徑
path = r'D:\Chrome\Application\chromedriver.exe'
# (2) 創建瀏覽器操作對象
browser = webdriver.Chrome(path) # (3) 訪問網站 # url = 'https://www.baidu.com' # 打開網頁 # browser.get(url)
url = 'https://www.jd.com/' browser.get(url) # page_source方法獲取網頁源碼
content = browser.page_source print(content)
seckill是由js渲染出來的,而js要在瀏覽器中運行,通過urllib.request.urlopen(url)模擬瀏覽器發出請求對象無法獲得