一、重定向
1.重定向(redirect)就是通過各種方法將各種網絡請求重新定個方向轉到其它位置,從地址A跳轉到地址B了。
2.重定向狀態碼:
--301 redirect: 301 代表永久性轉移(Permanently Moved)
--302 redirect: 302 代表暫時性轉移(Temporarily Moved )
3.eg:先登錄csdn打開我的博客首頁,進入寫博客編輯界面,記住這個地址:https://mp.csdn.net/postedit ,退出csdn登錄,把剛才寫博客地址輸入瀏覽器回車,抓包會看到這個請求狀態碼是307,瀏覽器地址欄瞬間刷新跳到登錄首頁去了
二、禁止重定向(allow_redirects)
1.用get方法請求:https://mp.csdn.net/postedit
2.打印狀態碼是200,這是因為requets庫自動處理了重定向請求了
3.自動處理重定向地址后,我們就獲取不到重定向后的url了,就無法走下一步,這里我們可以設置一個參數禁止重定向:allow_redirects=False
(allow_redirects=True是啟動重定向),然后就可以看到status_code是302了(這里實操是307)
302/307的區別詳見:https://www.cnblogs.com/wuguanglin/p/redirect.html
三、獲取重定向后的地址
1.在第一個請求后,服務器會下發一個新的請求鏈接,在response的Headers里,如下抓包:Location
2.用腳本去獲取Location地址
四、代碼參考
# coding:utf-8 import requests import urllib3 urllib3.disable_warnings() # 請求頭 headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36" } s = requests.session() # 打開寫博客 r = s.get('https://mp.csdn.net/postedit', headers=headers, allow_redirects=False, verify=False) # 打印狀態碼,自動處理重定向請求 print(r.status_code) new_url = r.headers["Location"] print(new_url)