python+selenium實現網頁自動化與爬蟲技術

本文轉載自查看原文 2020-04-14 22:39 1383 python/ 自動化測試/ selenium

一、python環境與selenium環境安裝

二、搜索商品后點擊搜索按鈕提交

三、元素定位，找到對應信息，並保存

四、結果預覽與總結

舉例某購物網站，通過selenium與python，實現主頁上商品的搜索，並將信息爬蟲保存至本地excel表內。

一、python環境與selenium環境安裝

python在官網下載並安裝並且設置環境變量。

selenium通過命令行下，pip install selenium進行安裝，python與selenium都建議使用3.0版本

這里使用chrome瀏覽器，下載chrome對應版本的webdrver驅動，將webdriver驅動放在python跟目錄下。

chrome瀏覽器的版本通過這個方法查詢:幫助-關於Google Chrome(G)

二、搜索商品后點擊搜索按鈕提交

這里需要用到selenium庫、time庫（其中sleep用於等待）以及xlwt（用於保存excel表）

 1 from selenium import  webdriver
 2 from time import sleep
 3 import xlwt
 4 #打開瀏覽器,這里用的chrome
 5 d=webdriver.Chrome()
 6 #設置窗口最大化
 7 d.maximize_window()
 8 #設置隱式等待
 9 d.implicitly_wait(30)
10 #打開網頁
11 d.get("https://www.jd.com/")
12 #使用元素定位id找到搜索框
13 d.find_element_by_id("key").send_keys("洗發水")
14 #使用xpath定位到搜索按鈕
15 d.find_element_by_xpath("/html/body/div[1]/div[4]/div/div[2]/div/div[2]/button").clic

三、元素定位，找到對應信息，並保存

 1 #初始化excel表
 2 excel=xlwt.Workbook(encoding="utf-8")
 3 #增加sheet頁
 4 sheet=excel.add_sheet("sheet1",cell_overwrite_ok=True)
 5 #定義第1行的內容,以及初始化num,用於從第二行開始寫入對應的數據
 6 sheet.write(0,0,'序號')
 7 sheet.write(0,1,'商品')
 8 sheet.write(0,2,'價格')
 9 num=1
10 #通過元素定位面找到,在頁面上找到對應商品的各個元素位置
11 goods=d.find_elements_by_xpath("/html/body/div[6]/div[2]/div[2]/div[1]/div/div[2]/ul/li")
12 sleep(5)
13 for good in goods:
14     #分別找到商品與價格所在的元素,並且取其中的文本信息,並去空行
15     price=good.find_element_by_xpath("div/div[3]/strong").text.replace("\n","-")
16     goodtext=good.find_element_by_xpath("div/div[4]/a/em").text.replace("\n","-")
17     sheet.write(num,0,num)
18     sheet.write(num,1,goodtext)
19     sheet.write(num,2,price)
20     num+=1
21     #print(goodtext,"|",price)
22 #保存至excel表
23 excel.save(r"C:\Users\Mr.White\Desktop\test001\jd.xls")
24 #頁面退出
25 d.quit()

四、結果預覽與總結

1、網頁自動化過程中最主要的難度是元素定位，后面會專門去介紹一下元素定位

2、頁面可能隨着前端代碼的變化，會使原本可以跑通的腳本失效，有一定維護成本，如何設計合理的自動化腳本就顯得比較重要。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python實現WEB自動化（python+selenium ） python+selenium實現web自動化 python+selenium UI自動化怎么實現 Python+Selenium自動化 Web自動化selenium技術快速實現爬蟲 python+selenium Web自動化之獲取網頁元素的基本方法【python+selenium自動化】圖像識別技術在UI自動化測試中的實際運用 python+selenium自動化（四）之selenium切換窗口【Selenium06篇】python+selenium實現Web自動化：日志處理 python+selenium自動化--參數化（paramunittest）