问题情景：

scrapy爬取网页，返回值418（按照请求来说，是一个完整的网络请求）。说明此接口已经被后台爬虫检测程序检测到了。

通过研读scrapy文档，在自定义的418检测下载中间件里面，process_response中检测返回值，并设置request的http/https代理,然后return request。

按照文档所述，此request会被加入到下载调度器中重新download。

bug:

返回的request未生效！！！没有重新下载！

request.dont_filter = True # 禁止被过滤掉

说明直接返回request会被过滤掉。需要设置dont_filter。

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 requests get请求返回码418问题解决 Scrapy 扩展中间件: 针对特定响应状态码，使用代理重新请求 scrapy输出请求状态码 python爬取网页时返回http状态码HTTP Error 418 python爬取网页时返回http状态码HTTP Error 418 scrapy框架查看请求状态码 Http请求返回状态码接口请求返回状态码总结 XMLHttpRequest HTTP请求的返回码为0 http status = 0 HTTP请求返回状态码详解