Java丨jsoup網絡爬蟲模擬登錄思路解析


直奔主題:

本篇文章是給有jsoup抓包基礎的人看的......

今天小編給大家寫一篇對於jsoup抓包時需要輸入驗證碼的解決方法之一。大神就繞道,嘿嘿~

任何抓包的基礎都是基於Http協議來進行這個抓包行為的,那么,在我們遇到驗證碼的時候怎么辦呢?別着急,繼續看

遇到需要驗證碼的這種情況怎么辦:

  例如我們要訪問www.xxxxx.com這個網站需要你輸入驗證碼,步驟如下:

1)首先我們二話不說,先訪問一下www.xxxxx.com這個網址,目的是什么?

a.獲取到cookies

b.為我們下一步獲取驗證碼做好准備

c.利用jsoup對www.xxxxx.com的第一次訪問獲取到的cookie來進行我們第二次的訪問。

2)我們第一次訪問完畢后進行第二次訪問要做些什么呢?

a.利用jsoup帶着cookie去訪問www.xxxxx.com/img/verifyCode.gif這個地址獲取驗證碼

b.將獲取到的驗證碼存入到本地(一般獲取到的是二進制形式的)

c.利用jsoup帶着cookie到www.xxxxx.com/img/verifyCode.gif獲取到的驗證碼我們是不是可以登錄了呢?

3)第三次訪問我們帶入帳號+密碼+驗證碼去登錄 重要的是不要把cookie忘帶了

a.第三次訪問www.xxxx.com/login.html?username=haojieli&password=123456&verifyCode=1234 在后面跟上cookie的值

解析:

重點是cookie ,cookie是會話的首要條件,cookie就相當於你要打電話,你輸入的電話要和對方的電話號碼對得上才能通上話,所以后面獲取驗證碼和登錄都必須帶上cookie,這是你訪問對方服務器的時候識別你的標准。

反之:你到服務器獲取驗證碼時候的cookie為123456789 ,而你登錄的時候的cookie是888888888 ,你打的電話都不是同一個電話 ,接電話的肯定不是同一個人,所以,訪問的時候注意保持cookie的一致!

博文到此結束,感謝您的觀看,希望對各位讀者有所幫助,如果有什么意見以及建議請在評論留言......

======祝各位讀者生活愉快======

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM