開始水第三篇,哈哈哈哈
URL:http://match.yuanrenxue.com/match/3

老規矩:F12,刷新

上面兩個一個是名單,一個是空,所以此次請求有關的就是在下面兩個
logo后面的狀態碼是202,看下202狀態碼的解釋:

點擊,打開我們看一下

就是一個鏈接,再看看其他的

POST + 202,假想一下,表單提交了某個東西到服務器,但是並未處理,像不像正在驗證什么東西
接着往下看

那么可以確定,點擊這個網頁

通過POST訪問上面整個網址,設置sessionid,好,先假想第一個請求,接下來看第二個

這其實就是有數據的一個請求

200 + GET + 數據是不是就和之前的假想一樣了
現在已經很清楚了,先這樣再那樣再那樣,我好了,你們呢~
不要慌,我們再來個斷點看看~
斷哪里呢,哪里有數據就斷哪里


直接來看這里~
不懂js都可以的啦,POST + /logo,
通過request的session.post請求/logo再通過session.get請求3
忘記session那塊內容的,這里推薦https://python3webspider.cuiqingcai.com/
復習下2.4章及其他的內容
爬取情況如下:


