一、重定向
1.重定向(redirect)就是通過各種方法將各種網絡請求重新定個方向轉到其它位置,從地址A跳轉到地址B了。
2.重定向狀態碼:
--301 redirect: 301 代表永久性轉移(Permanently Moved)
--302 redirect: 302 代表暫時性轉移(Temporarily Moved )
3.eg:先登錄csdn打開我的博客首頁,進入寫博客編輯界面,記住這個地址:https://mp.csdn.net/postedit ,退出csdn登錄,把剛才寫博客地址輸入瀏覽器回車,抓包會看到這個請求狀態碼是307,瀏覽器地址欄瞬間刷新跳到登錄首頁去了
二、禁止重定向(allow_redirects)
1.用get方法請求:https://mp.csdn.net/postedit
2.打印狀態碼是200,這是因為requets庫自動處理了重定向請求了

3.自動處理重定向地址后,我們就獲取不到重定向后的url了,就無法走下一步,這里我們可以設置一個參數禁止重定向:allow_redirects=False
(allow_redirects=True是啟動重定向),然后就可以看到status_code是302了(這里實操是307)

302/307的區別詳見:https://www.cnblogs.com/wuguanglin/p/redirect.html
三、獲取重定向后的地址
1.在第一個請求后,服務器會下發一個新的請求鏈接,在response的Headers里,如下抓包:Location

2.用腳本去獲取Location地址

四、代碼參考
# coding:utf-8
import requests
import urllib3
urllib3.disable_warnings()
# 請求頭
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36"
}
s = requests.session()
# 打開寫博客
r = s.get('https://mp.csdn.net/postedit',
headers=headers,
allow_redirects=False,
verify=False)
# 打印狀態碼,自動處理重定向請求
print(r.status_code)
new_url = r.headers["Location"]
print(new_url)
