網絡爬蟲(一):配置selenium、pycharm(windows平台)


最近在學習爬蟲的編寫,使用selenium模塊時候,遇到了很多坑,本blog的目的是總結一下遇到的坑和解決辦法,以便后來人少走彎路!

以下介紹均以Python3.x為基准進行,基於windows平台的。

1. Selenium配置

我們在做爬蟲的時候,避免不了要使用selenium模塊,但是它不是python的標准庫,所以需要自行安裝。
那么如何安裝selenium呢,這時候就用到了pip這個工具。

1. 首先我們需要下載pip:

所謂pip,即Python Install Packet(python安裝包)。

mark

2. 然后我們解壓下載的pip,打開cmd命令控制台,cd到剛才解壓的目錄:

mark

可以看到,python不是內部命令,執行失敗;這是由於python的可執行文件路徑沒有加入到windows的環境變量里。

3. 設置環境變量:

按照如下的順序:

計算機 -> 屬性 -> 高級系統設置 -> 高級 -> 環境變量 -> path

mark
mark


將python.exe所在路徑添加到path中(注意,不同路徑間的隔離使用;)

mark

4. 驗證pip是否安裝成功

使用如下命令(使用此命令之前,同樣需要將pip所在的目錄加入到環境變量中,默認的pip路徑為python.exe同目錄文件夾Scripts下):

  • pip list

mark

5. 安裝selenium模塊

采用如下命令:

  • pip install selenium

mark

至此,selenium模塊算是安裝完成了

6. 配置selenium使其支持不同瀏覽器

開發中,我們一般采用chrome或firefox,因此我以這兩款為准進行講解。
當我們安裝完成selenium模塊,准備使用其進行編碼時,突然發現,又有問題出現了:

mark
發生以上原因是因為: 缺少Chrome/Firefox的webdriver驅動。

驅動的下載地址:

將下載好的驅動解壓,然后放到與python.exe同一個目錄中;

到此處,你可以試試如下代碼:

# coding = utf-8
from time import sleep
from selenium import webdriver

browser = webdriver.Firefox()

browser.get(r"http://www.baidu.com")
browser.find_element_by_id("kw").send_keys("python")
browser.find_element_by_id("su").click()
sleep(5)
browser.quit()

將會打開一個新的firefox窗口,算是selenium配置成功。

2. Pycharm 2017.3破解與使用

Pycharm是玩python、web開發、爬蟲等等必不可少的工具,其優秀性不必多言,誰用誰知道!

1. 下載並安裝 Pycharm2017

mark
安裝不用多說了吧!

2. 破解pycharm


進入Pycharm, 點擊Help -> Register

mark

然后,去下載一個破解軟件:

按照下圖進行設置:

mark

輸入完成后,點擊Active,一切都ok了!

另外,破解的專業網站地址:

3. 注冊完成后,我們將開始我們第一個項目:

# coding = utf-8
from time import sleep
from selenium import webdriver

browser = webdriver.Firefox()

browser.get(r"http://www.baidu.com")
browser.find_element_by_id("kw").send_keys("python")
browser.find_element_by_id("su").click()
sleep(5)
browser.quit()

運行過程中,可能會出現如下的錯誤:
mark
mark

雖然我們安裝了selenium,但是Pycharm找不到這個模塊(包),這怎么回事呢?
原因就是我們使用的python 解釋器的問題(未使用系統默認的解釋器)

可做如下修改:

  • File -> Settings -> Project coding -> Project interpreter

選擇所需要的Python解釋器。
mark

mark

如下拉列表中沒有對應的系統Python解釋器,我們可以自己添加:

mark
mark

設置完以上之后,重新回到代碼區運行上述代碼,一切都ok了!

至此,大功告成!!!


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM