scrapy 啟動

本文轉載自查看原文 2018-08-06 19:52 1723 scrapy

虛擬環境安裝好了之后，scrapy 框架安裝好了以后：

workon article_spider (項目名稱)

scrapy startproject Article Spider 工程目錄

cd 到工程目錄

Scrapy genspider jobbole blog.jobbole.com 第一個文件名稱要爬取網站的域名

啟動一個工程的cmd： scrapy crawl jobbole

如果運行報 No module named “win32api”

要安裝 pip install pypiwin32 這個包

settings

把

這樣設置，否則遵循 robots.txt rules ,它將會不爬

如果是 xpath selector 對象想提取里面的內容，調用extract（）成一個列表，然后索引取出，但是列表沒有值，索引取出就會報錯，所以

extract_first 提取不到就返回None。比較好

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Scrapy同時啟動多個爬蟲 scrapy 框架的安裝與啟動 scrapy在pycharm配置啟動(無需命令行啟動) scrapy 啟動失敗，scrapy startproject test 出錯 'module' object has no attribute 'OP_NO_TLSv1_1 scrapy按順序啟動多個爬蟲代碼片段(python3) scrapy面試一 scrapy爬蟲 python scrapy scrapy配置 Scrapy 和 scrapy-redis的區別