（一）scrapy 安裝及新建爬蟲項目並運行

本文轉載自查看原文 2019-09-18 16:51 1037 爬蟲/ python

> 參考：https://www.cnblogs.com/hy123456/p/9847570.html

在 pycharm 中並沒有創建 scrapy 工程的選項，需要手動創建。

這里就有兩種創建 scrapy 項目的方式，第一種是先手工創建 scrapy 項目，然后導入到 pycharm 中；第二種是直接在 pycharm 中利用其中的命令行窗口創建項目（我使用的是這種，比較方便）；

1. 手工創建導入方式

創建一個用於當前項目的虛擬空間：
```
virtualenv --no-site-packages ScrapyLearning
```

啟動當前虛擬空間：

# 進入當前虛擬空間的相關目錄下，windows下在：ScrapyLearning/Scripts/
activate    # 激活當前虛擬空間

安裝 scrapy ：

pip install -i https://pypi.douban.com/simple/ scrapy   # 使用豆瓣源

使用 scrapy 創建 scrapy 項目：（千萬注意不要直接在 script 目錄下新建項目）
```
scrapy startproject ArticleSpider   # ArticleSpider為項目名
```
將 ArticleSpider 項目導入 pycharm。

2. `pycharm` 中創建

pycharm 中新建工程，並選擇創建一個用於當前項目的虛擬空間；
在 pycharm 的下端的 Terminal 中輸入以下命令以安裝 scrapy （如果沒有的話）：
```
pip install -i https://pypi.douban.com/simple/ scrapy   # 使用豆瓣源
```
在 pycharm 的下端的 Terminal 中輸入：
```
scrapy startproject ArticlePaqu
```
便會在當前項目目錄下生成 ArticlePaqu 文件夾，這個便是 scrapy 項目文件夾。

3.創建一個小爬蟲

創建一個單個小爬蟲，爬取 scrapy 官方指定的一個示例頁面：example.com。

命令行或 pycharm 的 Termina 窗口中輸入（這里需要進入前面新建的項目目錄下）：

scrapy genspider example 'www.example.com'

便會在 spider 文件夾下創建一個爬蟲 python 文件，並自動寫入初始代碼：

# -*- coding: utf-8 -*-
import scrapy

class ExampleSpider(scrapy.Spider):
    name = 'example'
    allowed_domains = ['example.com']
    start_urls = ['http://example.com/']

    def parse(self, response):
        pass

4.運行爬蟲

4-1.命令行或 `pycharm` 的 `Terminal` 中輸入：

scrapy crawl example

即可啟動 example 爬蟲。

4-2.直接通過運行 `pycharm` 中 `python` 文件的方式運行：

需要在 scrapy 項目的根目錄下創建一個 main.py 文件：

from scrapy.cmdline import execute

import sys
import os   # 用來獲取路徑的模塊

sys.path.append(os.path.dirname(os.path.abspath(__file__)))
execute(['scrapy', 'crawl', 'example'])

即相當於將

scrapy crawl example

命令分成三段組成 list 放入 python 執行程序中的 execute 函數中了。

然后就可以通過右鍵 run main.py 函數即可運行 example 爬蟲。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 如何利用scrapy新建爬蟲項目新建一個scrapy項目 [爬蟲框架scrapy]scrapy的安裝 Scrapy創建爬蟲項目手把手教你如何新建scrapy爬蟲框架的第一個項目（下） anaconda安裝scrapy庫並新建scrapy工程 python爬蟲之scrapy安裝（一） Scrapy怎樣同時運行多個爬蟲？ Scrapy：運行爬蟲程序的方式 Learning Scrapy筆記（七）- Scrapy根據Excel文件運行多個爬蟲