PyCharm調試運行Scrapy教程


一、使用scrapy創建一個項目

這里使用scrapy官方第一個示例

scrapy startproject tutorial

使用PyCharm打開項目,在tutorial/tutorial/spiders目錄下創建quotes_spider.py文件並寫入,以下代碼

import scrapy


class QuotesSpider(scrapy.Spider):
    name = "quotes"

    def start_requests(self):
        urls = [
            'http://quotes.toscrape.com/page/1/',
            'http://quotes.toscrape.com/page/2/',
        ]
        for url in urls:
            yield scrapy.Request(url=url, callback=self.parse)

    def parse(self, response):
        page = response.url.split("/")[-2]
        filename = 'quotes-%s.html' % page
        with open(filename, 'wb') as f:
            f.write(response.body)
        self.log('Saved file %s' % filename)
View Code

 

二、復制cmdline.py到項目主目錄

找到scrapy下的cmdline.py文件(比如我這里是D:\Language\Miniconda3\envs\default\Lib\site-packages\scrapy\cmdline.py)

復制一份到tutorial項目的根目錄下(scrapy.cfg文件的同一目錄下)

 

三、編緝文件調試運行配置

 

 Name--和上邊創建的spider文件相同,我這里叫quotes_spider

Script path--選擇當前項目下的cmdline.py,我這里是F:\PycharmProjects\tutorial\cmdline.py

Parameters--crawl+要調試運行的spider名稱,我這里是crawl quotes

Working directory--填項目所在主目錄,我這里是F:\PycharmProjects\tutorial

最后要注意點“Apply”,不要直接點“OK”

 

四、調示和運行演示

選擇調試,程序成功停在斷點處

選擇運行,程序也成功通行

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM