簡介
有些登錄的接口會有驗證碼:短信驗證碼,圖形驗證碼等,這種登錄的話驗證碼參數可以從后台獲取的(或者查數據庫最直接)。獲取不到也沒關系,可以通過添加cookie的方式繞過驗證碼。(注意:並不是所有的登錄都是用cookie來保
持登錄的,有些是用token登錄)
抓登錄cookie
1、如博客園登錄后會生成一個已登錄狀態的cookie,那么只需要直接把這個值添加到cookies里面就可以了。
2、可以先手動登錄一次,然后抓取這個cookie,這里就需要用抓包工具fiddler了
3、先打開博客園登錄界面,手動輸入賬號和密碼(勾選下次自動登錄)
4、打開fiddler抓包工具,刷新下登錄首頁,就是登錄前的cookie了
5、登錄成功后,再查看cookie變化,發現多了兩組參數,多的這兩組參數就是我們想要的,copy出來,一會有用
cookie組成結構
1、用抓包工具fidller只能看到cookie的name和value兩個參數,實際上cookie還有其它參數
2、以下是一個完整的cookie組成結構
cookie ={u'domain': u'.cnblogs.com', u'name': u'.CNBlogsCookie', u'value': u'xxxx', u'expiry': 1491887887, u'path': u'/', u'httpOnly': True, u'secure': False}
name:cookie的名稱
value:cookie對應的值,動態生成的
domain:服務器域名
expiry:Cookie有效終止日期
path:Path屬性定義了Web服務器上哪些路徑下的頁面可獲取服務器設置的Cookie
httpOnly:防腳本攻擊
secure:在Cookie中標記該變量,表明只有當瀏覽器和Web Server之間的通信協議為加密認證協議時,
瀏覽器才向服務器提交相應的Cookie。當前這種協議只有一種,即為HTTPS。
添加cookie
1、往session里面添加cookie可以用以下方式
2、set里面參數按括號里面的參數格式
coo = requests.cookies.RequestsCookieJar() coo.set('cookie-name', 'cookie-value', path='/', domain='.xxx.com') s.cookies.update(c)
3、於是添加登錄的cookie,把第一步fiddler抓到的內容填進去就可以了
c = requests.cookies.RequestsCookieJar() c.set('.CNBlogsCookie', 'xxx') c.set('.Cnblogs.AspNetCore.Cookies','xxx') s.cookies.update(c) print(s.cookies)
代碼運行,刷新隨筆
1、看到剛剛添加的隨筆
參考代碼
1、由於登錄時候是多加2個cookie,我們可以先用get方法打開登錄首頁,獲取部分cookie
2、再把登錄需要的cookie添加到session里
3、添加成功后,隨便編輯正文和標題保存到草稿箱
1 # coding:utf-8 2 import requests 3 # 先打開登錄首頁,獲取部分cookie 4 url = "https://passport.cnblogs.com/user/signin" 5 headers = { 6 "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64; rv:44.0) Gecko/20100101 Firefox/44.0" 7 } # get方法其它加個ser-Agent就可以了 8 s = requests.session() 9 r = s.get(url, headers=headers,verify=False) 10 print s.cookies 11 # 添加登錄需要的兩個cookie 12 c = requests.cookies.RequestsCookieJar() 13 c.set('.CNBlogsCookie', 'xxx') # 填上面抓包內容 14 c.set('.Cnblogs.AspNetCore.Cookies','xxx') # 填上面抓包內容 15 s.cookies.update(c) 16 print s.cookies 17 # 登錄成功后保存編輯內容 18 url2= "https://i.cnblogs.com/EditPosts.aspx?opt=1" 19 body = {"__VIEWSTATE": "", 20 "__VIEWSTATEGENERATOR":"FE27D343", 21 "Editor$Edit$txbTitle":"這是繞過登錄的標題:北京-宏哥", 22 "Editor$Edit$EditorBody":"<p>這里是中文內容:http://www.cnblogs.com/duhong/</p>", 23 "Editor$Edit$Advanced$ckbPublished":"on", 24 "Editor$Edit$Advanced$chkDisplayHomePage":"on", 25 "Editor$Edit$Advanced$chkComments":"on", 26 "Editor$Edit$Advanced$chkMainSyndication":"on", 27 "Editor$Edit$lkbDraft":"存為草稿", 28 } 29 r2 = s.post(url2, data=body, verify=False) 30 print r.content