Python3爬蟲登錄模擬


使用Python爬蟲登錄系統之后,能夠實現的操作就多了很多,下面大致介紹下如何使用Python模擬登錄。

我們都知道,在前端的加密驗證,只要把將加密環境還原出來,便能夠很輕易地登錄。

首先分析登錄的步驟,通過審查元素得知

<input type="button" id="login" name="login" class="login" onclick="Logon();" value="登錄">

點擊按鈕觸發Logon()函數,然后查找Logon()函數定義

function Logon() {
}

函數定義內容各有不同,一般里面包含一些加密的操作,一般是使用寫好的js加密。我們所需要做的便是重復這些步驟,加密數據。

對於加密,有三種方法:

第一,如果加密方法是base64之類的,可以直接用Python3的base64庫加密;

第二,手動模仿;

第三,直接調用js加密,需要先下載PyExecJS,有的電腦需要先安裝js的運行環境,比如Node.js。使用方法如下:

newusername = execjs.compile(content).call('base64encode', username)

其中content是js內容,base64encode是方法,username是參數,newusername是加密后的數據。

對於驗證碼的問題,先介紹下一般的圖片驗證碼,可以請求獲取驗證碼的地址,session之類的數據自己搞定,一般便可以請求成功,可以存到本地手動輸入,也可以使用識別的第三方模塊,但這個識別效果並不是很好。

然后,便是查看session,cookie。

接下來的操作就是構造請求頭headers,這個可以自行去控制台查看或者使用wireshark, fiddler之類的抓包軟件查看。

最后便可以請求數據:

使用

 s = requests.Session()
 s.headers.update(headers)
 r = s.post(url, data = params)

或者:

  r = requests.get(url, headers = headers, data = params)

headers是你構造的請求頭,url是你請求的網站,params是加密的數據。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM