python基礎 — Selenium 詳細介紹


一、Selenium+Python環境搭建及配置

1.1 selenium 介紹

selenium 是一個 web 的自動化測試工具,不少學習功能自動化的同學開始首選 selenium ,因為它相比 QTP 有諸多有點:

  • 免費,也不用再為破解 QTP 而大傷腦筋
  • 小巧,對於不同的語言它只是一個包而已,而 QTP 需要下載安裝1個多 G 的程序。
  • 這也是最重要的一點,不管你以前更熟悉 C、 java、ruby、python、或都是 C# ,你都可以通過 selenium 完成自動化測試,而 QTP 只支持 VBS
  • 支持多平台:windows、linux、MAC ,支持多瀏覽器:ie、ff、safari、opera、chrome
  • 支持分布式測試用例的執行,可以把測試用例分布到不同的測試機器的執行,相當於分發機的功能。

官方文檔:

1.2 selenium+Python環境配置

前提條件:已安裝好Python開發環境(推薦安裝Python3.5及以上版本)

安裝步驟:

  1. 安裝selenium
    Win:pip install selenium
    Mac:pip3 install selenium

  2. 安裝webdriver
    各大瀏覽器webdriver地址可參見:https://docs.seleniumhq.org/download/
    Firefox:https://github.com/mozilla/geckodriver/releases/
    Chrome:https://sites.google.com/a/chromium.org/chromedriver/ 或者
    http://chromedriver.storage.googleapis.com/index.html
    IE:http://selenium-release.storage.googleapis.com/index.html
    注:webdriver需要和對應的瀏覽器版本以及selenium版本對應

Webdriver版本 支持的Chrome版本
v2.41 v67-69
v2.40 v66-68
v2.39 v66-68
v2.38 v65-67
v2.37 v64-66
v2.36 v63-65
v2.35 v62-64
v2.34 v61-63
v2.33 v60-62
  1. webdriver安裝路徑
    Win:復制webdriver到Python安裝目錄下
    Mac:復制webdriver到/usr/local/bin目錄下

二、元素定位及瀏覽器基本操作

2.1 啟動瀏覽器

2.1.1 普通方式啟動

啟動Chrome瀏覽器:

from selenium import webdriver browser = webdriver.Chrome() browser.get('http://www.baidu.com/') 

啟動Firefox瀏覽器:

from selenium import webdriver browser = webdriver.Firefox() browser.get('http://www.baidu.com/') 

啟動IE瀏覽器:

from selenium import webdriver browser = webdriver.Ie() browser.get('http://www.baidu.com/') 

2.1.2 Headless方式啟動

Headless Chrome 是 Chrome 瀏覽器的無界面形態,可以在不打開瀏覽器的前提下,使用所有 Chrome 支持的特性運行你的程序。相比於現代瀏覽器,Headless Chrome 更加方便測試 web 應用,獲得網站的截圖,做爬蟲抓取信息等。相比於較早的 PhantomJS,SlimerJS 等,Headless Chrome 則更加貼近瀏覽器環境。

Headless Chrome 對Chrome版本要求:
官方文檔中介紹,mac和linux環境要求chrome版本是59+,而windows版本的chrome要求是60+,同時chromedriver要求2.30+版本。

from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.common.action_chains import ActionChains from selenium.webdriver.common.keys import Keys chrome_options = webdriver.ChromeOptions() # 使用headless無界面瀏覽器模式 chrome_options.add_argument('--headless') //增加無界面選項 chrome_options.add_argument('--disable-gpu') //如果不加這個選項,有時定位會出現問題 # 啟動瀏覽器,獲取網頁源代碼 browser = webdriver.Chrome(chrome_options=chrome_options) mainUrl = "https://www.taobao.com/" browser.get(mainUrl) print(f"browser text = {browser.page_source}") browser.quit() 

2.1.3 加載配置啟動瀏覽器

Selenium操作瀏覽器是不加載任何配置的,下面是關於加載Chrome配置的方法:

用Chrome地址欄輸入chrome://version/,查看自己的“個人資料路徑”,然后在瀏覽器啟動時,調用這個配置文件,代碼如下:

#coding=utf-8 from selenium import webdriver option = webdriver.ChromeOptions() option.add_argument('--user-data-dir=C:\Users\Administrator\AppData\Local\Google\Chrome\User Data') #設置成用戶自己的數據目錄 driver=webdriver.Chrome(chrome_options=option) 

而加載Firefox配置的方法有些不同:

打開Firefox點右上角設置>?(幫助)>故障排除信息>顯示文件夾,打開后把路徑復制下來就可以了

# coding=utf-8 from selenium import webdriver # 配置文件地址 profile_directory = r'C:\Users\xxx\AppData\Roaming\Mozilla\Firefox\Profiles\1x41j9of.default' # 加載配置配置 profile = webdriver.FirefoxProfile(profile_directory) # 啟動瀏覽器配置 driver = webdriver.Firefox(profile) 

2.2 元素定位

對象的定位應該是自動化測試的核心,要想操作一個對象,首先應該識別這個對象。一個對象就是一個人一樣,他會有各種的特征(屬性),如比我們可以通過一個人的身份證號,姓名,或者他住在哪個街道、樓層、門牌找到這個人。那么一個對象也有類似的屬性,我們可以通過這個屬性找到這對象。

webdriver 提供了一系列的對象定位方法,常用的有以下幾種:

  • id定位:find_element_by_id()
  • name定位:find_element_by_name()
  • class定位:find_element_by_class_name()
  • link定位:find_element_by_link_text()
  • partial link定位:find_element_by_partial_link_text()
  • tag定位:find_element_by_tag_name()
  • xpath定位:find_element_by_xpath()
  • css定位:find_element_by_css_selector()
#coding=utf-8 from selenium import webdriver browser=webdriver.Firefox() browser.get("http://www.baidu.com") #########百度輸入框的定位方式########## #通過id方式定位 browser.find_element_by_id("kw").send_keys("selenium") #通過name方式定位 browser.find_element_by_name("wd").send_keys("selenium") #通過tag name方式定位 browser.find_element_by_tag_name("input").send_keys("selenium") #通過class name方式定位 browser.find_element_by_class_name("s_ipt").send_keys("selenium") #通過CSS方式定位 browser.find_element_by_css_selector("#kw").send_keys("selenium") #通過xpath方式定位 browser.find_element_by_xpath("//input[@id='kw']").send_keys("selenium") ############################################ browser.find_element_by_id("su").click() time.sleep(3) browser.quit() 

2.2.1 class含有空格時解決方法:

在實際進行元素定位時,經常發現class name是有多個class組合的復合類,中間以空格隔開。如果直接進行定位會出現報錯,可以通過以下方式處理:

  • class屬性唯一但是有空格,選擇空格兩邊唯一的那一個
  • 若空格隔開的class不唯一可以通過索引進行定位
    self.driver.find_elements_by_class_name('table-dragColumn')[0].click()
  • 通過css方法進行定位(空格以‘.’代替)
#前面加(.)空格地方用點(.)來代替 self.driver.find_element_by_css_selector('.dtb-style-1.table-dragColumns').click() #包含整個類 self.driver.find_element_by_css_selector('class="dtb-style-1 table-dragColumns').click() 

參考代碼:

# coding:utf-8 from selenium import webdriver driver = webdriver.Firefox() driver.get("http://mail.126.com/") driver.implicitly_wait(20) driver.switch_to.frame("x-URS-iframe") # 方法一:取單個class屬性 driver.find_element_by_class_name("dlemail").send_keys("yoyo") driver.find_element_by_class_name("dlpwd").send_keys("12333") # 方法二:定位一組取下標定位(乃下策) driver.find_elements_by_class_name("j-inputtext")[0].send_keys("yoyo") driver.find_elements_by_class_name("j-inputtext")[1].send_keys("12333") # 方法三:css定位 driver.find_element_by_css_selector(".j-inputtext.dlemail").send_keys("yoyo") driver.find_element_by_css_selector(".j-inputtext.dlpwd").send_keys("123") # 方法四:取單個class屬性也是可以的 driver.find_element_by_css_selector(".dlemail").send_keys("yoyo") driver.find_element_by_css_selector(".dlpwd").send_keys("123") # 方法五:直接包含空格的CSS屬性定位大法 driver.find_element_by_css_selector("[class='j-inputtext dlemail']").send_keys("yoyo") 

2.3 selenium三種等待方式

有時候為了保證腳本運行的穩定性,需要腳本中添加等待時間。

2.3.1 強制等待

第一種也是最簡單粗暴的一種辦法就是強制等待sleep(xx),需要引入“time”模塊,這種叫強制等待,不管你瀏覽器是否加載完了,程序都得等待3秒,3秒一到,繼續執行下面的代碼,作為調試很有用,有時候也可以在代碼里這樣等待,不過不建議總用這種等待方式,太死板,嚴重影響程序執行速度。

# -*- coding: utf-8 -*- from selenium import webdriver import time driver = webdriver.Firefox() driver.get('http://baidu.com') time.sleep(3) # 強制等待3秒再執行下一步 print(driver.current_url) driver.quit() 

2.3.2 隱性等待

第二種辦法叫隱性等待,通過添加 implicitly_wait() 方法就可以方便的實現智能等待;implicitly_wait(30) 的用法應該比 time.sleep() 更智能,后者只能選擇一個固定的時間的等待,前者可以 在一個時間范圍內智能的等待。

# -*- coding: utf-8 -*- from selenium import webdriver driver = webdriver.Firefox() driver.implicitly_wait(30) # 隱性等待,最長等30秒 driver.get('http://baidu.com') print(driver.current_url) driver.quit() 

隱形等待是設置了一個最長等待時間,如果在規定時間內網頁加載完成,則執行下一步,否則一直等到時間截止,然后執行下一步。注意這里有一個弊端,那就是程序會一直等待整個頁面加載完成,也就是一般情況下你看到瀏覽器標簽欄那個小圈不再轉,才會執行下一步,但有時候頁面想要的元素早就在加載完成了,但是因為個別js之類的東西特別慢,我仍得等到頁面全部完成才能執行下一步,我想等我要的元素出來之后就下一步怎么辦?有辦法,這就要看selenium提供的另一種等待方式——顯性等待wait了。
需要特別說明的是:隱性等待對整個driver的周期都起作用,所以只要設置一次即可,我曾看到有人把隱性等待當成了sleep在用,走哪兒都來一下…

2.3.3 顯性等待

第三種辦法就是顯性等待,WebDriverWait,配合該類的until()和until_not()方法,就能夠根據判斷條件而進行靈活地等待了。它主要的意思就是:程序每隔xx秒看一眼,如果條件成立了,則執行下一步,否則繼續等待,直到超過設置的最長時間,然后拋出TimeoutException。

wait模塊的WebDriverWait類是顯性等待類,先看下它有哪些參數與方法:

selenium.webdriver.support.wait.WebDriverWait(類)

init

driver: 傳入WebDriver實例,即我們上例中的driver timeout: 超時時間,等待的最長時間(同時要考慮隱性等待時間) poll_frequency: 調用until或until_not中的方法的間隔時間,默認是0.5秒 ignored_exceptions: 忽略的異常,如果在調用until或until_not的過程中拋出這個元組中的異常,則不中斷代碼,繼續等待,如果拋出的是這個元組外的異常,則中斷代碼,拋出異常。默認只有NoSuchElementException。 

until

method: 在等待期間,每隔一段時間(__init__中的poll_frequency)調用這個傳入的方法,直到返回值不是False message: 如果超時,拋出TimeoutException,將message傳入異常 

until_not

until相反,until是當某元素出現或什么條件成立則繼續執行, until_not是當某元素消失或什么條件不成立則繼續執行,參數也相同,不再贅述。 

看了以上內容基本上很清楚了,調用方法如下:

WebDriverWait(driver, 超時時長, 調用頻率, 忽略異常).until(可執行方法, 超時時返回的信息)

這里需要特別注意的是until或until_not中的可執行方法method參數,很多人傳入了WebElement對象,如下:

WebDriverWait(driver, 10).until(driver.find_element_by_id('kw')) # 錯誤

這是錯誤的用法,這里的參數一定要是可以調用的,即這個對象一定有 call() 方法,否則會拋出異常:

TypeError: 'xxx' object is not callable

在這里,你可以用selenium提供的 expected_conditions 模塊中的各種條件,也可以用WebElement的 is_displayed() 、is_enabled()、**is_selected() **方法,或者用自己封裝的方法都可以。

#coding=utf-8 from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.support.wait import WebDriverWait base_url = "http://www.baidu.com" driver = webdriver.Firefox() driver.implicitly_wait(5) '''隱式等待和顯示等待都存在時,超時時間取二者中較大的''' locator = (By.ID,'kw') driver.get(base_url) WebDriverWait(driver,10).until(EC.title_is(u"百度一下,你就知道")) '''判斷title,返回布爾值''' WebDriverWait(driver,10).until(EC.title_contains(u"百度一下")) '''判斷title,返回布爾值''' WebDriverWait(driver,10).until(EC.presence_of_element_located((By.ID,'kw'))) '''判斷某個元素是否被加到了dom樹里,並不代表該元素一定可見,如果定位到就返回WebElement''' WebDriverWait(driver,10).until(EC.visibility_of_element_located((By.ID,'su'))) '''判斷某個元素是否被添加到了dom里並且可見,可見代表元素可顯示且寬和高都大於0''' WebDriverWait(driver,10).until(EC.visibility_of(driver.find_element(by=By.ID,value='kw'))) '''判斷元素是否可見,如果可見就返回這個元素''' WebDriverWait(driver,10).until(EC.presence_of_all_elements_located((By.CSS_SELECTOR,'.mnav'))) '''判斷是否至少有1個元素存在於dom樹中,如果定位到就返回列表''' WebDriverWait(driver,10).until(EC.visibility_of_any_elements_located((By.CSS_SELECTOR,'.mnav'))) '''判斷是否至少有一個元素在頁面中可見,如果定位到就返回列表''' WebDriverWait(driver,10).until(EC.text_to_be_present_in_element((By.XPATH,"//*[@id='u1']/a[8]"),u'設置')) '''判斷指定的元素中是否包含了預期的字符串,返回布爾值''' WebDriverWait(driver,10).until(EC.text_to_be_present_in_element_value((By.CSS_SELECTOR,'#su'),u'百度一下')) '''判斷指定元素的屬性值中是否包含了預期的字符串,返回布爾值''' #WebDriverWait(driver,10).until(EC.frame_to_be_available_and_switch_to_it(locator)) '''判斷該frame是否可以switch進去,如果可以的話,返回True並且switch進去,否則返回False''' #注意這里並沒有一個frame可以切換進去 WebDriverWait(driver,10).until(EC.invisibility_of_element_located((By.CSS_SELECTOR,'#swfEveryCookieWrap'))) '''判斷某個元素在是否存在於dom或不可見,如果可見返回False,不可見返回這個元素''' #注意#swfEveryCookieWrap在此頁面中是一個隱藏的元素 WebDriverWait(driver,10).until(EC.element_to_be_clickable((By.XPATH,"//*[@id='u1']/a[8]"))).click() '''判斷某個元素中是否可見並且是enable的,代表可點擊''' driver.find_element_by_xpath("//*[@id='wrapper']/div[6]/a[1]").click() #WebDriverWait(driver,10).until(EC.element_to_be_clickable((By.XPATH,"//*[@id='wrapper']/div[6]/a[1]"))).click() #WebDriverWait(driver,10).until(EC.staleness_of(driver.find_element(By.ID,'su'))) '''等待某個元素從dom樹中移除''' #這里沒有找到合適的例子 WebDriverWait(driver,10).until(EC.element_to_be_selected(driver.find_element(By.XPATH,"//*[@id='nr']/option[1]"))) '''判斷某個元素是否被選中了,一般用在下拉列表''' WebDriverWait(driver,10).until(EC.element_selection_state_to_be(driver.find_element(By.XPATH,"//*[@id='nr']/option[1]"),True)) '''判斷某個元素的選中狀態是否符合預期''' WebDriverWait(driver,10).until(EC.element_located_selection_state_to_be((By.XPATH,"//*[@id='nr']/option[1]"),True)) '''判斷某個元素的選中狀態是否符合預期''' driver.find_element_by_xpath(".//*[@id='gxszButton']/a[1]").click() instance = WebDriverWait(driver,10).until(EC.alert_is_present()) '''判斷頁面上是否存在alert,如果有就切換到alert並返回alert的內容''' print instance.text instance.accept() driver.close() 

2.4 瀏覽器操作

2.4.1 瀏覽器最大化、最小化

將瀏覽器最大化顯示

browser.maximize_window()

將瀏覽器最小化顯示

browser.minimize_window()

2.4.2 瀏覽器設置窗口大小

設置瀏覽器寬480、高800顯示

browser.set_window_size(480, 800)

2.4.3 瀏覽器前進后退

前進

browser.forword()

后退

browser.back()


2.5 操作測試對象

一般來說,webdriver 中比較常用的操作對象的方法有下面幾個:

  • click——點擊對象
  • send_keys——在對象上模擬按鍵輸入
  • clear——清除對象的內容,如果可以的話
  • submit——提交對象的內容,如果可以的話
  • text——用於獲取元素的文本信息

2.6 鍵盤事件

要想調用鍵盤按鍵操作需要引入 keys 包:
from selenium.webdriver.common.keys import Keys通過 send_keys()調用按鍵:
send_keys(Keys.TAB) # TAB
send_keys(Keys.ENTER) # 回車

參考代碼:

#coding=utf-8 from selenium import webdriver from selenium.webdriver.common.keys import Keys #需要引入 keys 包 import os,time driver = webdriver.Firefox() driver.get("http://passport.kuaibo.com/login/?referrer=http%3A%2F%2Fwebcloud .kuaibo.com%2F") time.sleep(3) driver.maximize_window() # 瀏覽器全屏顯示 driver.find_element_by_id("user_name").clear() driver.find_element_by_id("user_name").send_keys("fnngj") #tab 的定位相相於清除了密碼框的默認提示信息,等同上面的 clear() driver.find_element_by_id("user_name").send_keys(Keys.TAB) time.sleep(3) driver.find_element_by_id("user_pwd").send_keys("123456") #通過定位密碼框,enter(回車)來代替登陸按鈕 driver.find_element_by_id("user_pwd").send_keys(Keys.ENTER) #也可定位登陸按鈕,通過 enter(回車)代替 click() driver.find_element_by_id("login").send_keys(Keys.ENTER) time.sleep(3) driver.quit() 

鍵盤組合鍵的用法:

#ctrl+a 全選輸入框內容 driver.find_element_by_id("kw").send_keys(Keys.CONTROL,'a') 
#ctrl+x 剪切輸入框內容 driver.find_element_by_id("kw").send_keys(Keys.CONTROL,'x') 

2.7 鼠標事件

鼠標事件一般包括鼠標右鍵、雙擊、拖動、移動鼠標到某個元素上等等。
需要引入ActionChains類。
引入方法:
from selenium.webdriver.common.action_chains import ActionChains

ActionChains 常用方法:
perform()  執行所有ActionChains 中存儲的行為;
context_click()  右擊;
double_click()   雙擊;
drag_and_drop()  拖動;
move_to_element()  鼠標懸停。

鼠標雙擊示例:

#定位到要雙擊的元素 qqq =driver.find_element_by_xpath("xxx") #對定位到的元素執行鼠標雙擊操作 ActionChains(driver).double_click(qqq).perform() 

鼠標拖放示例:

#定位元素的原位置 element = driver.find_element_by_name("source") #定位元素要移動到的目標位置 target = driver.find_element_by_name("target") #執行元素的移動操作 ActionChains(driver).drag_and_drop(element, target).perform() 

2.8 多層框架/層級定位

定位元素過程中經常會遇到找不到元素的問題,出現該問題一般都是以下因素導致:

  • 元素定位方法不對
  • 頁面存在iframe或內嵌窗口
  • 頁面超時

webdriver 提供了一個 switch_to_frame 方法,可以很輕松的來解決這個問題。
用法:

#先找到到 ifrome1(id = f1) browser.switch_to_frame("f1") 

同樣的,如果是內嵌窗口:
browser.switch_to_window("f1")


2.9 Expected Conditions解析

Expected Conditions的使用場景有2種:

  • 直接在斷言中使用
  • 與WebDriverWait配合使用,動態等待頁面上元素出現或者消失

相關方法:

  • title_is: 判斷當前頁面的title是否精確等於預期
  • title_contains: 判斷當前頁面的title是否包含預期字符串
  • presence_of_element_located:判斷某個元素是否被加到了dom樹里,並不代表該元素一定可見
  • visibility_of_element_located:判斷某個元素是否可見.可見代表元素非隱藏,並且元素的寬和高都不等於0
  • visibility_of:跟上面的方法做一樣的事情,只是上面的方法要傳入locator,這個方法直接傳定位到的element就好了
  • presence_of_all_elements_located:判斷是否至少有1個元素存在於dom樹中。舉個例子,如果頁面上有n個元素的class都是'column-md-3',那么只要有1個元素存在,這個方法就返回True
  • text_to_be_present_in_element:判斷某個元素中的text是否包含了預期的字符串
  • text_to_be_present_in_element_value:判斷某個元素中的value屬性是否包含了預期的字符串
  • frame_to_be_available_and_switch_to_it:判斷該frame是否可以switch進去,如果可以的話,返回True並且switch進去,否則返回False
  • invisibility_of_element_located:判斷某個元素中是否不存在於dom樹或不可見
  • element_to_be_clickable:判斷某個元素中是否可見並且是enable的,這樣的話才叫clickable
  • staleness_of:等某個元素從dom樹中移除,注意,這個方法也是返回True或False
  • element_to_be_selected:判斷某個元素是否被選中了,一般用在下拉列表
  • element_selection_state_to_be:判斷某個元素的選中狀態是否符合預期
  • element_located_selection_state_to_be:跟上面的方法作用一樣,只是上面的方法傳入定位到的element,而這個方法傳入locator
  • alert_is_present:判斷頁面上是否存在alert,這是個老問題,很多同學會問到

示例:
判斷title:title_is()、title_contains()

  1. 首先導入expected_conditions模塊
  2. 由於這個模塊名稱比較長,所以為了后續的調用方便,重新命名為EC了(有點像數據庫里面多表查詢時候重命名)
  3. 打開博客首頁后判斷title,返回結果是True或False
# coding:utf-8 from selenium import webdriver from selenium.webdriver.support import expected_conditions as EC driver = webdriver.Firefox() driver.get("http://baidu.com") # 判斷title完全等於 title = EC.title_is(u'百度') print title(driver) # 判斷title包含 title1 = EC.title_contains(u'百度') print title1(driver) # 另外一種寫法 r1 = EC.title_is(u'百度')(driver) r2 = EC.title_contains(u'百度')(driver) print r1 print r2 

三、Selenium速查表

3.1 Python Webdriver Exception速查表

webdriver在使用過程中可能會出現各種異常,我們需要了解該異常並知道如何進行異常處理。

異常 描述
WebDriverException 所有webdriver異常的基類,當有異常且不屬於下列異常時拋出
InvalidSwitchToTargetException 下面兩個異常的父類,當要switch的目標不存在時拋出
NoSuchFrameException 當你想要用switch_to.frame()切入某個不存在的frame時拋出
NoSuchWindowException 當你想要用switch_to.window()切入某個不存在的window時拋出
NoSuchElementException 元素不存在,一般由find_element與find_elements拋出
NoSuchAttributeException 一般你獲取不存在的元素屬性時拋出,要注意有些屬性在不同瀏覽器里是有不同的屬性名的
StaleElementReferenceException 指定的元素過時了,不在現在的DOM樹里了,可能是被刪除了或者是頁面或iframe刷新了
UnexpectedAlertPresentException 出現了意料之外的alert,阻礙了指令的執行時拋出
NoAlertPresentException 你想要獲取alert,但實際沒有alert出現時拋出
InvalidElementStateException 下面兩個異常的父類,當元素狀態不能進行想要的操作時拋出
ElementNotVisibleException 元素存在,但是不可見,不可以與之交互
ElementNotSelectableException 當你想要選擇一個不可被選擇的元素時拋出
InvalidSelectorException 一般當你xpath語法錯誤的時候拋出這個錯
InvalidCookieDomainException 當你想要在非當前url的域里添加cookie時拋出
UnableToSetCookieException 當driver無法添加一個cookie時拋出
TimeoutException 當一個指令在足夠的時間內沒有完成時拋出
MoveTargetOutOfBoundsException actions的move操作時拋出,將目標移動出了window之外
UnexpectedTagNameException 獲取到的元素標簽不符合要求時拋出,比如實例化Select,你傳入了非select標簽的元素時
ImeNotAvailableException 輸入法不支持的時候拋出,這里兩個異常不常見,ime引擎據說是僅用於linux下對中文/日文支持的時候
ImeActivationFailedException 激活輸入法失敗時拋出
ErrorInResponseException 不常見,server端出錯時可能會拋
RemoteDriverServerException 不常見,好像是在某些情況下驅動啟動瀏覽器失敗的時候會報這個錯

3.2 Xpath&Css定位方法速查表

描述 Xpath Css
直接子元素 //div/a div > a
子元素或后代元素 //div//a div a
以id定位 //div[@id='idValue']//a div#idValue a
以class定位 //div[@class='classValue']//a div.classValue a
同級弟弟元素 //ul/li[@class='first']/following- ul>li.first + li
屬性 //form/input[@name='username'] form input[name='username']
多個屬性 //input[@name='continue' and input[name='continue'][type='button
第4個子元素 //ul[@id='list']/li[4] ul#list li:nth-child(4)
第1個子元素 //ul[@id='list']/li[1] ul#list li:first-child
最后1個子元素 //ul[@id='list']/li[last()] ul#list li:last-child
屬性包含某字段 //div[contains(@title,'Title')] div[title*="Title"]
屬性以某字段開頭 //input[starts-with(@name,'user')] input[name^="user"]
屬性以某字段結尾 //input[ends-with(@name,'name')] input[name$="name"]
text中包含某字段 //div[contains(text(), 'text')] 無法定位
元素有某屬性 //div[@title] div[title]
父節點 //div/.. 無法定位
同級哥哥節點 //li/preceding-sibling::div[1] 無法定位

Tips

這里介紹一款在線代碼美化工具,在線訪問地址:
https://carbon.now.sh

另外如果使用Vscode的話,可以安裝對應的插件進行快速在線美化。

  • 打開Vscode,在插件欄輸入:carbon-now-sh
  • 點擊安裝
  • 點擊重新加載即可安裝
  • 按快捷鍵ALT+CMD+A(win系統下使用:ALT+WIN+A)即可

效果預覽:

 
 
四、Selenium 瀏覽器無界面操作
 
# coding=utf-8
from selenium import webdriver
import time

'''
使用selenium時,只需要在chrome里面添加參數chrome_options 運行時就會是無界面的狀態
'''


def chrome():
    chrome_options = webdriver.ChromeOptions()
    # 瀏覽器不提供可視化頁面  add_argument('--headless')
    chrome_options.add_argument('--headless')
    # 禁用GPU加速   add_argument('--disable-gpu')
    chrome_options.add_argument('--disable-gpu')

    # 啟動瀏覽器
    browser = webdriver.Chrome(chrome_options=chrome_options)
    Url = "https://www.taobao.com/"
    browser.get(Url)

    browser.set_window_size(1280, 800)  # 分辨率 1280*800
    print(browser.get_window_size())

    browser.implicitly_wait(5)
    time.sleep(2)
    # 停2秒后,抓取快照
    browser.save_screenshot('taobao.jpeg')
    print("[info] screenshot done!!")

    # 獲取網頁源代碼
    browser.get(Url)
    print(f"browser text = {browser.page_source}")
    browser.quit()


if __name__ == '__main__':
    chrome()

 

補充:


chrome_options.add_argument('--user-agent=""')   # 設置請求頭的User-Agent
chrome_options.add_argument('--window-size=1280x1024')   # 設置瀏覽器分辨率(窗口大小)
chrome_options.add_argument('--start-maximized')   # 最大化運行(全屏窗口),不設置,取元素會報錯
chrome_options.add_argument('--disable-infobars')    # 禁用瀏覽器正在被自動化程序控制的提示
chrome_options.add_argument('--incognito')   # 隱身模式(無痕模式)
chrome_options.add_argument('--hide-scrollbars')   # 隱藏滾動條, 應對一些特殊頁面
chrome_options.add_argument('--disable-javascript')    # 禁用javascript
chrome_options.add_argument('--blink-settings=imagesEnabled=false')    # 不加載圖片, 提升速度
chrome_options.add_argument('--headless')     # 瀏覽器不提供可視化頁面

chrome_options.add_argument('--ignore-certificate-errors')    # 禁用擴展插件並實現窗口最大化
chrome_options.add_argument('--disable-gpu')    # 禁用GPU加速
chrome_options.add_argument('–disable-software-rasterizer')
chrome_options.add_argument('--disable-extensions')
chrome_options.add_argument('--start-maximized')    # 窗口最大化

但窗口最大化不能直接用 add_argument('--start-maximized') ,就上面代碼案例,我是用了另外一個方法

browser.set_window_size(1280, 800)  # 分辨率 1280*800 來固定好瀏覽器窗口大小

 


 

 
 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM