爬蟲模擬登陸之formdata表單數據

本文轉載自查看原文 2017-06-28 18:09 1706

首先HTTP協議是個無連接的協議，瀏覽器和服務器之間是以循環往復的請求回復來交互的，交互的形式是以文件形式來進行的。比如在chrome開發者工具network中看到了

每一行是一個文件，又文件大小啊，文件類型啊，比如腳本，圖片等。

根據協議，把每個文件的內容按照協議格式填入HTTP數據協議結構，其中，對於爬蟲模擬登陸來說最重要的是表單數據formdata這個字段

在這我們看到又loginname字段，又password字段，我們看到這都是明碼，所以做了遮擋。我們得到了這個，就可以根據字段名稱自己組裝數據了，

另外還需要注意的是，formdata所在的文件，前面我們說了，瀏覽器與服務器之間是以文件形式交互的，開發者工具也是以文件為單位來抓包的，所以我們需要找對文件

這個只能自己找了，比如知乎，包含賬號密碼的表單數據存在與“email"文件中，比如在智聯招聘中，包含賬號密碼的表單數據存在與“login"文件中

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 爬蟲處理登陸表單爬蟲——cookie模擬登陸 Python 爬蟲模擬登陸知乎爬蟲入門之scrapy模擬登陸(十四) Python爬蟲實例（四）網站模擬登陸爬蟲模擬登陸的幾種方法 Node爬蟲——利用superagent模擬登陸 Java模擬post提交表單數據 php curl模擬登陸抓取數據 python爬蟲模擬登陸校園網-初級