scrapy中 Request方法中的meta參數是什么？干什么用的？

本文轉載自查看原文 2018-11-03 11:12 658 爬蟲


#在items模塊中有下面三個參數：
import scrapy
class TextItem(spider.Item):
    title = scrapy.Field()
    price = scrapy.Field()
    image = scrapy.Field()
#在spider爬蟲中：
class TaobaoSpider(scrapy.Spider):
    name = ['taobao']
    allowed_domains = ['www.taobao.com']
    def parse1(self,response):
        '''
        需要知道的是item是一個字典
        '''
        item = TextItem()
        for product in response.css('......').extract():
            item['title'] = product.css('......').extract_first()
            item['price'] = product.css('......').extract_first()
            url = product.css('......').extract_first()
            yield = scrapy.Request(url=url, meta={'item':item} callback=self.parse2)
            '''
            比如我們要爬取淘寶上的商品，我們在第一層爬取時候獲得了標題(title)和價格(price)，
            但是還想獲得商品的圖片，就是那些點進去的大圖片，假設點進去的鏈接是上述代碼的url，
            利用scrpy.Request請求url后生成一個Request對象，通過meta參數，把item這個字典賦值給meta字典的'item'鍵，
            即meta={'item':item}，這個meta參數會被放在Request對象里一起發送給parse2()函數。

            '''
    def parse2(self,response):
        item = response.meta['item']
        for product in response.css('......').extract():
            item[imgae] = product.scc('......').extract_first()
        return item
        '''
        這個response已含有上述meta字典，此句將這個字典賦值給item，完成信息傳遞。
        這個item已經和parse中的item一樣了
        之后我們就可以做圖片url提取的工作了，
        數據提取完成后return item ，這樣就完成了數據抓取的任務了。

        '''

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 criteria.setCacheable(true);這個方法是干什么用的你知道服務器是什么嗎？服務器是干什么用的？ [轉]scrapy中的request.meta db107s是什么電子元件，ASEMI整流橋DB107S干什么用的 vscode里的launch.json是干什么用的 sql中問號是干什么的？？ java中instanceof是怎么用的，干什么使的，舉例！ Scrm軟件是干什么的、scrm是什么意思【HBase】協處理器是什么？又能干什么？怎么用？ Nginx 是什么 ,Nginx能干什么,Nginx怎么使用

scrapy中 Request方法中的meta參數 是什么？ 干什么用的？

免責聲明！

scrapy中 Request方法中的meta參數是什么？干什么用的？