實現12306模擬登錄--Python


登錄頁面:https://kyfw.12306.cn/otn/resources/login.html

1、首先要找出登錄接口和圖片生成、驗證接口。

輸入錯誤帳號密碼、驗證碼,點擊登錄后會發生兩個請求:

驗證碼驗證:https://kyfw.12306.cn/passport/captcha/captcha-check?callback=jQuery19106790857650370608_1578397516228&answer=175%2C83%2C20%2C34&rand=sjrand&login_site=E&_=1578397516231

驗證碼生成:https://kyfw.12306.cn/passport/captcha/captcha-image64?login_site=E&module=login&rand=sjrand&1578398948914&callback=jQuery19106790857650370608_1578397516228&_=1578397516232

整理一下最終 生成驗證碼圖片URL:https://kyfw.12306.cn/passport/captcha/captcha-image64

2、接下來研究如何驗證驗證碼的

接着剛才操作,再次選擇驗證碼某個圖片點擊登錄,對比了一下剛才的驗證鏈接,有個關鍵參數(answer)不同(如下圖),通過多次請求發現answer參數其實是 坐標

多次嘗試就知道每張圖大概坐標(也可以通過QQ、微信截圖來驗證),如下圖

接下來就驗證一下是否正確:首先把圖片下載下來,(人工)識別選擇對應圖片,輸入坐標傳參進行請求

import requests,base64

session = requests.session()
res_image = session.get('https://kyfw.12306.cn/passport/captcha/captcha-image64').json()
with open('code.jpg','wb') as f:
    f.write(base64.b64decode(res_image["image"]))

code = input("坐標:")
code_data = {
    'answer': code,
    'rand': 'sjrand',
    'login_site': 'E'
}
res_captcha = session.get('https://kyfw.12306.cn/passport/captcha/captcha-check',params=code_data)
print(res_captcha.text)
3、驗證成功了就成功了一半,接下來請求登錄。

在頁面上選中正確的圖片(驗證碼不通過不會觸發login請求)后點擊登錄,抓取https://kyfw.12306.cn/passport/web/login 請求鏈接,查看攜帶什么參數請求,如下圖

發現除了攜帶用戶、密碼外,還有固定參數appid,驗證碼坐標answer。

那來驗證一下是否返回如圖上信息:

login_data = {
    'username': account,
    'password': pwd,
    'appid': 'otn',
    'answer': code
}
res_login = session.post("https://kyfw.12306.cn/passport/web/login",data=login_data)
print(res_login.text)

結果返回了error html頁面。(可能在某地方做了反爬)

於是加了headers:host、origin、referer、UA,還是不行.......

后來發現login鏈接有一大串cookie參數

再次點擊登陸,查看兩次的cookie變化,發現只有 RAIL_DEVICEID 的值沒有變化,其它都是動態變的。那問題來了,這些cookie是如何得來的?

經過研究后,首先請求12306首頁鏈接(https://kyfw.12306.cn/)可以獲取cookie:route、BIGipServerotn、JSESSIONID 的值。

然后請求生成驗證碼圖片鏈接(https://kyfw.12306.cn/passport/captcha/captcha-image64)可獲取cookie:BIGipServerpool_passport、passport_session、passport_ct 的值。

但是還沒找到 RAIL_DEVICEID 的值,結果發現請求鏈接是隱藏在js文件里。

暫時無法獲取,先手動配置RAIL_DEVICEID(將頁面的復制下來),就可以登錄成功(如下圖)。

代碼整理如下:

import requests
import base64
import time
import json
# from account import account,pwd
account='asdasd'
pwd='234234'

headers={
    "Host": "kyfw.12306.cn",
    "Referer": "https://kyfw.12306.cn/otn/resources/login.html",
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.64 Safari/537.36",
}

def create_code():
    codes = input("輸入圖片位置:")
    coordinate = {
        "1": "50,50",
        "2": "110,50",
        "3": "180,50",
        "4": "240,50",
        "5": "50,110",
        "6": "110,110",
        "7": "180,110",
        "8": "240,110",
    }
    return ",".join([coordinate[i] for i in codes.split(" ")])

session=requests.Session()
session.get("https://kyfw.12306.cn/",headers=headers)

image_url = 'https://kyfw.12306.cn/passport/captcha/captcha-image64?login_site=E&module=login&rand=sjrand'
res_image = session.get(image_url,headers = headers)
with open('code.jpg','wb') as f:
    f.write(base64.b64decode(res_image.json()["image"]))

captcha_url='https://kyfw.12306.cn/passport/captcha/captcha-check'
code = create_code()
code_data = {
    'answer': code,
    'rand': 'sjrand',
    'login_site': 'E'
}
res_captcha = session.get(captcha_url,headers = headers,params=code_data)
print(res_captcha.text)

dfp = "R0_Khr5gNf5pLQtbuTMr0Dfq75SM21U2PGxA3RjAWrKl3aJf0f-9gOocv_UNgSxNukbRy0hLjTETOwzFoJFNeEWly6vzn7Q0vIyImgDbDC9oiVKtIv08Pp2dnEJn6YJwmr6uQMK74Fu7i3XNC7e9mBgW_6XYRjuo"
session.cookies.set('RAIL_DEVICEID' , dfp)

login_data = {
    'username': account,
    'password': pwd,
    'appid': 'otn',
    'answer': code
}
res_login = session.post("https://kyfw.12306.cn/passport/web/login",headers=headers,data=login_data)
print(res_login.text)


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM