scrapy中的request

本文转载自查看原文 2017-07-02 16:05 3384 框架-Scrapy

scrapy中的request
初始化参数
class scrapy.http.Request(
url [ ,
callback,
method='GET',
headers,
body,
cookies,
meta,
encoding='utf-8',
priority=0,
 don't_filter=False,
 errback ] )


1，生成Request的方法
def parse_page1(self, response):
    return scrapy.Request("http://www.example.com/some_page.html",
                          callback=self.parse_page2)

def parse_page2(self, response):
    # this would log http://www.example.com/some_page.html
    self.logger.info("Visited %s", response.url)

2，通过Request传递数据的方法
def parse_page1(self, response):
    item = MyItem()
    item['main_url'] = response.url
    request = scrapy.Request("http://www.example.com/some_page.html",
                             callback=self.parse_page2)
    request.meta['item'] = item
    yield request

def parse_page2(self, response):
    item = response.meta['item']
    item['other_url'] = response.url
    yield item

3，Request.meta中的特殊关键字


4,主要子类FormRequest,用于登陆
return [FormRequest(url="http://www.example.com/post/action",
                    formdata={'name': 'John Doe', 'age': '27'},
                    callback=self.after_post)]

更相信的登陆的例子
import scrapy

class LoginSpider(scrapy.Spider):
    name = 'example.com'
    start_urls = ['http://www.example.com/users/login.php']

    def parse(self, response):
        return scrapy.FormRequest.from_response(
            response,
            formdata={'username': 'john', 'password': 'secret'},
            callback=self.after_login
        )

    def after_login(self, response):
        # check login succeed before going on
        if "authentication failed" in response.body:
            self.logger.error("Login failed")
            return

        # continue scraping with authenticated session...

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 关于scrapy中scrapy.Request中的属性 python——scrapy中Request参数 Scrapy - Request 中的回调函数callback不执行 Scrapy中scrapy.Request和response.follow的区别 Scrapy-Request中的回调函数不执行 scrapy中如何设置request的重试次数 scrapy - Request 中的回调函数不执行 [转]scrapy中的request.meta Scrapy 中 Request 对象和 Response 对象的各参数及属性介绍 Scrapy中的反反爬、logging设置、Request参数及POST请求