忙了一段時間沒來學習了,今天學習下如何跳過登錄驗證碼登錄
首先我們很多系統的登錄機制都會有短信驗證或者圖形驗證等,每次自動化代碼走到登錄的時候,因為隨機的驗證碼,導致無從下手
其實據我所知是有很多種方法可以做到識別驗證碼或者抓取驗證碼插入的,不過今天我們先一起學習下如何通過cookie繞過驗證碼登錄系統
用百度的登錄做個例子:
from selenium import webdriver
driver = webdriver.Chrome()
driver.get("https://www.baidu.com/")
driver.find_element_by_link_text("登錄").click()
t = driver.switch_to_alert()
#切換到alert彈窗
driver.find_element_by_css_selector("[class='tang-pass-footerBarULogin pass-link']").click()
這個時候就到了輸入用戶名和密碼的窗口了,接着寫入用戶名 和密碼點擊登錄的代碼:
driver.find_element_by_css_selector("[class='pass-text-input pass-text-input-userName']").send_keys("XXX")
driver.find_element_by_css_selector("[class='pass-text-input pass-text-input-password']").send_keys("XXX")
driver.find_element_by_css_selector("#TANGRAM__PSP_10__submit").click()
這個時候你就發現,彈出的手機驗證碼的頁面,即使發送了驗證碼,系統也無法接收到手機驗證碼,所以一般的流程下是無法使用自動化代碼登錄成功的
這里帶入一些driver.cookie的方法,
1.get_cookies():獲取所有 cookies
2.driver.get_cookie(name):獲取指定 name 的 cookie:
3.清除指定 cookie:delete_cookie()
4.delete_all_cookies():清除所有 cookies
5.add_cookie(cookie_dict):添加 cookie
我們要用的就是第五個,添加登錄后的cookie值來繞過登錄驗證碼
首先通過get_cookies()獲取所有 cookies 格式如下:
[{'domain': '.baidu.com', 'httpOnly': False, 'name': 'H_PS_PSSID', 'path': '/', 'secure': False, 'value': '1431_21104_18559_28131_28267'}, {'domain': '.baidu.com', 'httpOnly': False, 'name': 'delPer', 'path': '/', 'secure': False, 'value': '0'}, {'domain': '.baidu.com', 'expiry': 3695019135.360794, 'httpOnly': False, 'name': 'BAIDUID', 'path': '/', 'secure': False, 'value': 'B972D8DB7A1AA0C96556FD1E705B8071:FG=1'}, {'domain': '.baidu.com', 'expiry': 3695019135.36084, 'httpOnly': False, 'name': 'PSTM', 'path': '/', 'secure': False, 'value': '1547535489'}, {'domain': '.baidu.com', 'expiry': 3695019135.360821, 'httpOnly': False, 'name': 'BIDUPSID', 'path': '/', 'secure': False, 'value': 'B972D8DB7A1AA0C96556FD1E705B8071'}, {'domain': 'www.baidu.com', 'httpOnly': False, 'name': 'BD_HOME', 'path': '/', 'secure': False, 'value': '0'}, {'domain': 'www.baidu.com', 'expiry': 1548399488, 'httpOnly': False, 'name': 'BD_UPN', 'path': '/', 'secure': False, 'value': '12314353'}]
再使用抓包工具fiddler 抓取登錄后的cookie,登錄前和登錄后的對比 登錄后會多出的cookie數據:
BDUSS=10cjB0UWdKWGt5UUhBcWxrR3MzV3ZFWW12Zk5KNkkyRjFPdHI3cGxyeWpFV1ZjQVFBQUFBJCQAAAAAAAAAAAEAAADTqzeQuu.....
對應的name值為‘’BDUSS‘’
對應的value值為‘’10cjB0UWdKWGt5UUhBcWxrR3MzV3ZFWW12Zk5KNkkyRjFPdHI3cGxyeWpFV1ZjQVFBQUFBJCQAAAAAAAAAAAEAAADTqzeQuu.....‘’
我們截取cookie格式的第一個括號內容:
{'domain': '.baidu.com', 'httpOnly': False, 'name': 'H_PS_PSSID', 'path': '/', 'secure': False, 'value': '1431_21104_18559_28131_28267'}
然后執行cookie內容的替換和添加:
完整代碼如下
from selenium import webdriver
driver = webdriver.Chrome()
driver.get("https://www.baidu.com/")
cookie = {u'domain': u'.baidu.com',
u'httpOnly': False,
u'name': u'BDUSS',
u'path': u'/',
u'secure': False,
u'value': u'JXTlVLYjhtWEJvOG55VUlBM3NpbGFYT0lSVXVDQk1SN1NkWlFPWHJjalpEbVZjQVFBQUFBJCQAAAAAAAAAAAEAAADTqzeQuu.....}
driver.add_cookie(cookie)
#添加登錄后的cookie跳過登錄驗證
driver.refresh()
#刷新頁面
這樣我們就可以不用煩驗證碼的隨機性了,直接就可以登錄系統了
注:
1.fiddle的抓包工具不會使用的話可以再百度上找,挺簡單的,也挺使用的工具
2.登錄時候要勾選下次自動登錄按鈕
3.add_cookie()只添加 name 和 value,對於博客園的登錄是不成功。
4.本方法並不適合所有的網站,一般像百度這種記住登錄狀態的才會適