scrapy從命令行傳值

本文轉載自查看原文 2019-09-18 04:02 407 python/ scrapy

1.新建文件run.py

from scrapy.cmdline import execute


# tmall：爬蟲的名字
# pro=男裝為需要傳入的參數值
execute(['scrapy', 'crawl', 'tmall', '-a', 'pro=男裝', '--nolog'])

# 下面是無參數用法
# execute(['scrapy', 'crawl', 'tmall', '--nolog'])

2.爬蟲.py中重寫init方法，傳入參數；（字典編碼以字符串形式拼接到url后邊）

# 倒入頭文件 （字典編碼后以參數形式拼接到url）
from urllib.parse import urlencode


class TmallSpider(scrapy.Spider):
    name = 'tmall'
    allowed_domains = ['tmall.com']

    def __init__(self, pro=None, *args, **kwargs):
        super(TmallSpider, self).__init__(*args, **kwargs)
        self.params = {
            'q': pro,
            'total_Page': 1,
            'jumpto': 1,
        }

        self.start_url = 'https://list.tmall.com/search_product.htm?' + urlencode(self.params)

    def start_requests(self):
        print('self.start_url:' + self.start_url)
        # yield scrapy.Request(
        #     url=self.start_url,
        #     callback=self.get_total_page,
        #     dont_filter=True,
        # )

    def get_total_page(self, response):
        pass

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 robotframework從命令行傳入參數從命令行運行SikuliX scrapy 命令行基本用法 Scrapy命令行基本用法 Maven-11: 從命令行調用插件 Linux從命令行重置USB設備從命令行直接執行 python 文件中的函數從命令行打開IntelliJ IDEA及IntelliJ IDEA CE java之從命令行獲取數據的三種方式 Scrapy框架的命令行詳解【轉】