登錄頁面:https://kyfw.12306.cn/otn/resources/login.html
1、首先要找出登錄接口和圖片生成、驗證接口。
輸入錯誤帳號密碼、驗證碼,點擊登錄后會發生兩個請求:
整理一下最終 生成驗證碼圖片URL:https://kyfw.12306.cn/passport/captcha/captcha-image64
2、接下來研究如何驗證驗證碼的
接着剛才操作,再次選擇驗證碼某個圖片點擊登錄,對比了一下剛才的驗證鏈接,有個關鍵參數(answer)不同(如下圖),通過多次請求發現answer參數其實是 坐標
多次嘗試就知道每張圖大概坐標(也可以通過QQ、微信截圖來驗證),如下圖
接下來就驗證一下是否正確:首先把圖片下載下來,(人工)識別選擇對應圖片,輸入坐標傳參進行請求
import requests,base64
session = requests.session()
res_image = session.get('https://kyfw.12306.cn/passport/captcha/captcha-image64').json()
with open('code.jpg','wb') as f:
f.write(base64.b64decode(res_image["image"]))
code = input("坐標:")
code_data = {
'answer': code,
'rand': 'sjrand',
'login_site': 'E'
}
res_captcha = session.get('https://kyfw.12306.cn/passport/captcha/captcha-check',params=code_data)
print(res_captcha.text)
3、驗證成功了就成功了一半,接下來請求登錄。
在頁面上選中正確的圖片(驗證碼不通過不會觸發login請求)后點擊登錄,抓取https://kyfw.12306.cn/passport/web/login 請求鏈接,查看攜帶什么參數請求,如下圖
發現除了攜帶用戶、密碼外,還有固定參數appid,驗證碼坐標answer。
那來驗證一下是否返回如圖上信息:
login_data = {
'username': account,
'password': pwd,
'appid': 'otn',
'answer': code
}
res_login = session.post("https://kyfw.12306.cn/passport/web/login",data=login_data)
print(res_login.text)
結果返回了error html頁面。(可能在某地方做了反爬)
於是加了headers:host、origin、referer、UA,還是不行.......
后來發現login鏈接有一大串cookie參數
再次點擊登陸,查看兩次的cookie變化,發現只有 RAIL_DEVICEID 的值沒有變化,其它都是動態變的。那問題來了,這些cookie是如何得來的?
經過研究后,首先請求12306首頁鏈接(https://kyfw.12306.cn/)可以獲取cookie:route、BIGipServerotn、JSESSIONID 的值。
然后請求生成驗證碼圖片鏈接(https://kyfw.12306.cn/passport/captcha/captcha-image64)可獲取cookie:BIGipServerpool_passport、passport_session、passport_ct 的值。
但是還沒找到 RAIL_DEVICEID 的值,結果發現請求鏈接是隱藏在js文件里。
暫時無法獲取,先手動配置RAIL_DEVICEID(將頁面的復制下來),就可以登錄成功(如下圖)。
代碼整理如下:
import requests
import base64
import time
import json
# from account import account,pwd
account='asdasd'
pwd='234234'
headers={
"Host": "kyfw.12306.cn",
"Referer": "https://kyfw.12306.cn/otn/resources/login.html",
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.64 Safari/537.36",
}
def create_code():
codes = input("輸入圖片位置:")
coordinate = {
"1": "50,50",
"2": "110,50",
"3": "180,50",
"4": "240,50",
"5": "50,110",
"6": "110,110",
"7": "180,110",
"8": "240,110",
}
return ",".join([coordinate[i] for i in codes.split(" ")])
session=requests.Session()
session.get("https://kyfw.12306.cn/",headers=headers)
image_url = 'https://kyfw.12306.cn/passport/captcha/captcha-image64?login_site=E&module=login&rand=sjrand'
res_image = session.get(image_url,headers = headers)
with open('code.jpg','wb') as f:
f.write(base64.b64decode(res_image.json()["image"]))
captcha_url='https://kyfw.12306.cn/passport/captcha/captcha-check'
code = create_code()
code_data = {
'answer': code,
'rand': 'sjrand',
'login_site': 'E'
}
res_captcha = session.get(captcha_url,headers = headers,params=code_data)
print(res_captcha.text)
dfp = "R0_Khr5gNf5pLQtbuTMr0Dfq75SM21U2PGxA3RjAWrKl3aJf0f-9gOocv_UNgSxNukbRy0hLjTETOwzFoJFNeEWly6vzn7Q0vIyImgDbDC9oiVKtIv08Pp2dnEJn6YJwmr6uQMK74Fu7i3XNC7e9mBgW_6XYRjuo"
session.cookies.set('RAIL_DEVICEID' , dfp)
login_data = {
'username': account,
'password': pwd,
'appid': 'otn',
'answer': code
}
res_login = session.post("https://kyfw.12306.cn/passport/web/login",headers=headers,data=login_data)
print(res_login.text)