Scrapy爬蟲返回302重定向問題解決方法

本文轉載自查看原文 2021-01-18 11:36 1176 爬蟲

scrapy爬蟲遇到爬取頁面時302重定向導致response頁面與實際需要爬取的頁面信息不一致，導致無法正常獲取信息，查看日志存在 scrapy.downloadermiddlewares.redirect 。
解決方法：
有些網站需要檢查cookies頭部信息，這樣無需登錄就能進行訪問，所以可以在settings中添加頭部信息cookies，同時將cookies_enabled參數置為false，即可正常進行爬取操作

# Disable cookies (enabled by default)
COOKIES_ENABLED = False

DEFAULT_REQUEST_HEADERS = {
    'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.97 Safari/537.36',
    'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3',
    'Accept-Language': 'zh-CN,zh;q=0.9',
    'cookie':'xxxxxxxxx'
}

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 scrapy 解決302重定向問題 scrapy——解決302重定向 Scrapy的301、302重定向問題原因及解決辦法 scrapy爬蟲返回302，301，解決方法 HttpClient如何解決302重定向問題 HttpClient如何解決302重定向問題 302重定向 302重定向 springCloud gateway 302重定向問題頁面POST請求302重定向解決方案