cookies是什么 ?
cookies是服務器放在用戶機器上的一小塊信息. cookies用來保存登錄信息,這樣用戶就不用每次從同一台機器訪問頁面都要再次輸入登錄信息
cookie的成分
名稱、值(必需);域(網站不能訪問其他域生成的cookie)、路徑(將cookie的訪問權限控制在服務器中的特定目錄)、失效日期(規定cookie何時應該刪除,默認下關閉瀏覽器時就會刪除cookie,也可以自己設置刪除時間)、安全標志(true還是false)
如何獲取cookies?
通過burpsuite等抓包工具,或firebug等
接下來寫個模擬登錄知乎的demo--
我先從firebug中獲取到的cookies存儲到cookies文件中,是一個長字符串.
#coding:utf-8 import requests def get_cookies(): with open('cookies','r') as f: cookies = {} for line in f.read().split(';'): name, value = line.strip().split('=',1) #1代表只分割一次 cookies[name] = value return cookies s = requests.Session() url = 'http://www.zhihu.com/' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36' } req2 = s.get(url, headers=headers, cookies=get_cookies()) html = req2.content with open('zhihu.html', 'wb') as f1: f1.write(html)
執行demo.py后,用瀏覽器打開zhihu.html,則顯示的為登錄后的頁面