首先HTTP協議是個無連接的協議,瀏覽器和服務器之間是以循環往復的請求回復來交互的,交互的形式是以文件形式來進行的。比如在chrome開發者工具network中看到了
每一行是一個文件,又文件大小啊,文件類型啊,比如腳本,圖片等。
根據協議,把每個文件的內容按照協議格式填入HTTP數據協議結構,其中,對於爬蟲模擬登陸來說最重要的是表單數據formdata這個字段
在這我們看到又loginname字段,又password字段,我們看到這都是明碼,所以做了遮擋。我們得到了這個,就可以根據字段名稱自己組裝數據了,
另外還需要注意的是,formdata所在的文件,前面我們說了,瀏覽器與服務器之間是以文件形式交互的,開發者工具也是以文件為單位來抓包的,所以我們需要找對文件
這個只能自己找了,比如知乎,包含賬號密碼的表單數據存在與“email"文件中,比如在智聯招聘中,包含賬號密碼的表單數據存在與“login"文件中