1. 准備工作
在這之前請確保已經正確安裝好了Chrome瀏覽器並可以正常運行,安裝過程不再贅述。
2. 查看版本
點擊Chrome菜單“幫助”→“關於Google Chrome”,即可查看Chrome的版本號,如圖1-14所示。
圖1-14 Chrome版本號
這里我的Chrome版本是58.0。
請記住Chrome版本號,因為選擇ChromeDriver版本時需要用到。
3. 下載ChromeDriver
打開ChromeDriver的官方網站,可以看到最新版本為2.31,其支持的Chrome瀏覽器版本為58~60,官網頁面如圖1-15所示。
圖1-15 官網頁面
如果你的Chrome版本號是58~60,那么可以選擇此版本下載。
如果你的Chrome版本號不在此范圍,可以繼續查看之前的ChromeDriver版本。每個版本都有相應的支持Chrome版本的介紹,請找好自己的Chrome瀏覽器版本對應的ChromeDriver版本再下載,否則可能無法正常工作。
找好對應的版本號后,隨后到ChromeDriver鏡像站下載對應的安裝包即可:https://chromedriver.storage.googleapis.com/index.html。在不同平台下,可以下載不同的安裝包。
4. 環境變量配置
下載完成后,將ChromeDriver的可執行文件配置到環境變量下。
在Windows下,建議直接將chromedriver.exe文件拖到Python的Scripts目錄下,如圖1-16所示。(如果后面報錯,請注意這里放至位置,可以調整)
圖1-16 Python Scripts目錄
此外,也可以單獨將其所在路徑配置到環境變量,具體的配置方法請參見1.1節。
在Linux和Mac下,需要將可執行文件配置到環境變量或將文件移動到屬於環境變量的目錄里。
例如,要移動文件到/usr/bin目錄。首先,需要在命令行模式下進入其所在路徑,然后將其移動到/usr/bin:
1 |
sudo mv chromedriver /usr/bin |
當然,也可以將ChromeDriver配置到$PATH。首先,可以將可執行文件放到某一目錄,目錄可以任意選擇,例如將當前可執行文件放在/usr/local/chromedriver目錄下,接下來可以修改~/.profile文件,相關命令如下:
1 |
export PATH="$PATH:/usr/local/chromedriver" |
保存后執行如下命令:
1 |
source ~/.profile |
即可完成環境變量的添加。
5. 驗證安裝
配置完成后,就可以在命令行下直接執行chromedriver
命令了:
1 |
chromedriver |
如果輸入控制台有類似圖1-17所示的輸出,則證明ChromeDriver的環境變量配置好了。
圖1-17 控制台輸出
隨后再在程序中測試,執行如下Python代碼:
1 2 |
from selenium import webdriver browser = webdriver.Chrome() |
這里如果報錯了,首先看下,python.exe 和chromedriver.exe是不是在同一文件夾下,如果不是,可以將chromedriver.exe放至python.exe文件夾同一目錄下,然后再次嘗試。
運行之后,如果彈出一個空白的Chrome瀏覽器,則證明所有的配置都沒有問題。如果沒有彈出,請檢查之前的每一步配置。
如果彈出后閃退,則可能是ChromeDriver版本和Chrome版本不兼容,請更換ChromeDriver版本。
如果沒有問題,接下來就可以利用Chrome來做網頁抓取了。