這里來說一說selenium中的等待方式,其實在webdriver只有兩種類型等待方式,顯式等待和隱式等待,之前是在程序運行過程中使用time模塊中的sleep進行代碼的休眠進行強制等待,是顯式等待中的一種極端情況。
Time.sleep
通過time模塊中sleep進行代碼的暫停,但是實際使用過程中,如果都以sleep進行控制嚴重影響了程序的運行。
# coding=utf-8 # 強制等待——代碼休眠 import time from selenium import webdriver driver = webdriver.Chrome() driver.get("https://www.baidu.com") time.sleep(3) driver.quit()
顯式等待
顯式等待是你在代碼中定義等待一定條件發生后再進一步執行你的代碼。
示例:
# coding=utf-8 from time import ctime from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC dr = webdriver.Chrome() dr.get('https://www.baidu.com') try: print(ctime()) element = WebDriverWait(dr, 10).until( EC.presence_of_element_located((By.ID, "kw")) ) # WebDriverWait(driver=self.driver, timeout=300, poll_frequency=0.5, ignored_exceptions=None) # driver:瀏覽器驅動 # timeout:最長超時等待時間 # poll_frequency:檢測的時間間隔,默認為500ms # ignore_exception:超時后拋出的異常信息,默認情況下拋 NoSuchElementException 異常 print("我已找到") finally: print(ctime()) dr.quit()
執行結果:
以上代碼執行后就發現,整段代碼執行速度非常快,即使我在WebDriverWait中設置10秒,也不會等待10秒的情況,因為在不到一秒內,已經完成了加載並定位id為“kw”的元素。
通過WebDriverWait 和 ExpectedCondition 組合使用,讓我們的代碼執行只需要等待需要的時長,而不是固定的時長,這樣最大限度的節省時間。
此外ExpectedCondition類中提供了很多預期條件判斷方法,省去了再創建包的功夫:
1 """ 2 title_is:判斷當前頁面的title是否等於預期 3 title_contains:判斷當前頁面的title是否包含預期字符串 4 presence_of_element_located:判斷某個元素是否被加到了dom樹里,並不代表該元素一定可見 5 visibility_of_element_located:判斷某個元素是否可見. 可見代表元素非隱藏,並且元素的寬和高都不等於0 6 visibility_of:跟上面的方法做一樣的事情,只是上面的方法要傳入locator,這個方法直接傳定位到的element就好了 7 presence_of_all_elements_located:判斷是否至少有1個元素存在於dom樹中。舉個例子,如果頁面上有n個元素的class都是'column-md-3',那么只要有1個元素存在,這個方法就返回True 8 text_to_be_present_in_element:判斷某個元素中的text是否 包含 了預期的字符串 9 text_to_be_present_in_element_value:判斷某個元素中的value屬性是否包含了預期的字符串 10 frame_to_be_available_and_switch_to_it:判斷該frame是否可以switch進去,如果可以的話,返回True並且switch進去,否則返回False 11 invisibility_of_element_located:判斷某個元素中是否不存在於dom樹或不可見 12 element_to_be_clickable - it is Displayed and Enabled:判斷某個元素中是否可見並且是enable的,這樣的話才叫clickable 13 staleness_of:等某個元素從dom樹中移除,注意,這個方法也是返回True或False 14 element_to_be_selected:判斷某個元素是否被選中了,一般用在下拉列表 15 element_located_to_be_selected 16 element_selection_state_to_be:判斷某個元素的選中狀態是否符合預期 17 element_located_selection_state_to_be:跟上面的方法作用一樣,只是上面的方法傳入定位到的element,而這個方法傳入locator 18 alert_is_present:判斷頁面上是否存在alert 19 """
另外這里使用了until()函數也可以使用until_not()
隱式等待
如果某些元素不是立即可用的,隱式等待是告訴WebDriver去等待一定的時間后去查找元素。
# coding=utf-8 from selenium import webdriver from selenium.common.exceptions import NoSuchElementException from time import ctime driver = webdriver.Firefox() # 設置隱式等待為10秒 driver.implicitly_wait(10) driver.get("http://www.baidu.com") try: print(ctime()) driver.find_element_by_id("kw22").send_keys('selenium') except NoSuchElementException as e: print(e) finally: print(ctime()) driver.quit()
這里可以看到在10秒內沒有找到想要找到的元素,但是依舊執行了10秒,然后報錯,如果修改代碼為可以找到,代碼執行非常迅速。
implicitly_wait()默認參數的單位為秒,本例中設置等待時長為10秒。首先這10秒並非一個固定的等待時間,它並不影響腳本的執行速度。其次,它並不針對頁面上的某一元素進行等待。當腳本執行到某個元素定位時,如果元素可以定位,則繼續執行;如果元素定位不到,則它將以輪詢的方式不斷地判斷元素是否被定位到。假設在第6秒定位到了元素則繼續執行,若直到超出設置時長(10秒)還沒有定位到元素,則拋出異常。
好像也沒有很復雜……