爬蟲解決302 問題

本文轉載自查看原文 2018-09-21 18:42 3328 爬蟲相關問題

一：問題描述：

　　爬蟲微博信息，出現302跳轉，

　　比如訪問的URL是：https://weibo.com/2113535642?refer_flag=1001030103_ （圖片中標記為1）

　　然后跳轉的URL是：https://weibo.com/sgccjsdl?refer_flag=1001030103_&is_hot=1 （圖片中標記為2）

　　　　截圖如下所示：

　　　訪問圖中標記1 的URL的時候，沒有返回任何內容，但是response headers 返回了圖中標記2 的URL。如下圖所示：

下面是具體實現的代碼過程：

　　　　　　　result1 = session.get(url=str(user_url),headers=headers,verify=False,allow_redirects=False)
            result = result1.content
            new_requests_url = result1.headers['location']
            new_requests_url = "https://weibo.com" + new_requests_url

            if '<h1 class="username">' not in result:
                result = session.get(url=str(new_requests_url), headers=headers, verify=False, allow_redirects=False).content

　　　核心代碼是獲得需要跳轉的URL，代碼是 new_requests_url = result1.headers['location']

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 scrapy 解決302重定向問題 Spring MVC 請求路徑遇到的302問題的解決方法 HttpClient如何解決302重定向問題 HttpClient如何解決302重定向問題解決爬蟲中文亂碼問題解決爬蟲中文亂碼問題解決爬蟲網頁內容亂碼問題 34.scrapy解決爬蟲翻頁問題爬蟲解決網頁重定向問題 python爬蟲解決gbk亂碼問題

爬蟲 解決302 問題

免責聲明！

爬蟲解決302 問題