Cookies的處理

作用

保存客戶端的相關狀態

在爬蟲中如果遇到了cookie的反爬如何處理?

手動處理
    在抓包工具中捕獲cookie,將其封裝在headers中
    應用場景:cookie沒有有效時長且不是動態變化
    
自動處理
	使用session機制
	使用場景:動態變化的cookie
	session對象:該對象和requests模塊用法幾乎一致.如果在請求的過程中產生了cookie,如果該請求使用session發起的,則cookie會被自動存儲到session中.

案例

爬取雪球網中的新聞資訊數據:https://xueqiu.com/

#獲取一個session對象
import requests
headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'
}
session = requests.Session()
main_url = 'https://xueqiu.com' #推測對該url發起請求會產生cookie
session.get(main_url,headers=headers)
url = 'https://xueqiu.com/v4/statuses/public_timeline_by_category.json'
params = {
    'since_id': '-1',
    'max_id': '20346152',
    'count': '15',
    'category': '-1',
}
page_text = session.get(url,headers=headers,params=params).json()
page_text

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 【Python爬蟲】學習筆記 -- post請求的方法(Cookie反爬) Python爬蟲——反爬 python爬蟲--爬蟲與反爬 cookie反爬爬蟲反爬機制及反爬策略 js cookie反爬實戰 python爬蟲 - js逆向之svg字體反爬破解 Python爬蟲實戰——反爬機制的解決策略【阿里】 python 爬蟲汽車之家車輛參數反爬 python爬蟲 - 反爬之關於headers頭的accept-encoding的問題