一、使用scrapy創建一個項目
這里使用scrapy官方第一個示例
scrapy startproject tutorial
使用PyCharm打開項目,在tutorial/tutorial/spiders目錄下創建quotes_spider.py
文件並寫入,以下代碼

import scrapy class QuotesSpider(scrapy.Spider): name = "quotes" def start_requests(self): urls = [ 'http://quotes.toscrape.com/page/1/', 'http://quotes.toscrape.com/page/2/', ] for url in urls: yield scrapy.Request(url=url, callback=self.parse) def parse(self, response): page = response.url.split("/")[-2] filename = 'quotes-%s.html' % page with open(filename, 'wb') as f: f.write(response.body) self.log('Saved file %s' % filename)
二、復制cmdline.py到項目主目錄
找到scrapy下的cmdline.py文件(比如我這里是D:\Language\Miniconda3\envs\default\Lib\site-packages\scrapy\cmdline.py)
復制一份到tutorial項目的根目錄下(scrapy.cfg文件的同一目錄下)
三、編緝文件調試運行配置
Name--和上邊創建的spider文件相同,我這里叫quotes_spider
Script path--選擇當前項目下的cmdline.py,我這里是F:\PycharmProjects\tutorial\cmdline.py
Parameters--crawl+要調試運行的spider名稱,我這里是crawl quotes
Working directory--填項目所在主目錄,我這里是F:\PycharmProjects\tutorial
最后要注意點“Apply”,不要直接點“OK”
四、調示和運行演示
選擇調試,程序成功停在斷點處
選擇運行,程序也成功通行