Python爬蟲爬取知乎文章內容（解決最新js反爬2021.9 x-zse-96 2.0版本加密破解分析）

本文轉載自查看原文 2021-09-16 11:19 289 JS逆向

有個需求爬取知乎文章，正好記錄下爬取過程以及出現問題並解決方法
我是在沒有登錄的情況下爬取文章的

本文僅供研究與學習使用
知乎現今的 x-zse 參數的加密方法已升級成了：x-zse-96 2.0版本。
來看這篇帖子的應該都知道，這個參數動態唯一，沒有就拿不到api數據。
查閱了網上有關文章，僅有x-zse-86 2.0版本的解密方法，現今已不適用，加上之前寫的文章中有提及該解密方法，所以寫一篇最新的，供大家研究與學習。

1.F12進入源碼分析

2.響應json內容

https://www.zhihu.com/api/v4/search_v3?t=general&q=探店&correction=1&offset=20&limit=20&filter_fields=&lc_idx=20&show_all_topics=0&search_hash_id=7d9f263f8c4370bb21917e1edf6543da&vertical_info=0%2C1%2C1%2C0%2C0%2C0%2C0%2C0%2C0%2C1

3.斷點調試

4.md5參數加密

不難發現明文是 headers 里的 x-zse-93 + url + cookie.d_c0
知乎貌似一直都是采用 md5 加密方式進行數據加密的，直接上去測就好了。
在終端輸入：r.default(d)

運行結果：

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 知乎加密參數x-zse-96詳解爬取多篇知乎網文章內容 windows下使用python的scrapy爬蟲框架，爬取個人博客文章內容信息某乎搜索信息獲取(x-zse-96)參數JS逆向破解 php爬取微信文章內容 python爬蟲- js逆向解密之破解AES(CryptoJS)加密的反爬機制 python爬蟲 - js逆向解密之破解RSA加密數據的反爬機制 python爬蟲- js逆向解密之破解AES(CryptoJS)加密的反爬機制v2 python爬蟲 - js逆向之woff字體反爬破解 12、Python 高級反爬機制-破解js加密