有個需求爬取知乎文章,正好記錄下爬取過程以及出現問題並解決方法
我是在沒有登錄的情況下爬取文章的
本文僅供研究與學習使用
知乎現今的 x-zse 參數的加密方法已升級成了:x-zse-96 2.0版本。
來看這篇帖子的應該都知道,這個參數動態唯一,沒有就拿不到api數據。
查閱了網上有關文章,僅有x-zse-86 2.0版本的解密方法,現今已不適用,加上之前寫的文章中有提及該解密方法,所以寫一篇最新的,供大家研究與學習。
1.F12進入源碼分析
2.響應json內容
3.斷點調試
4.md5參數加密
不難發現明文是 headers 里的 x-zse-93 + url + cookie.d_c0
知乎貌似一直都是采用 md5 加密方式進行數據加密的,直接上去測就好了。
在終端輸入:r.default(d)
運行結果: