scrapy vs requests+beautifulsoup

本文转载自查看原文 2018-04-13 20:55 1780 爬虫

两种爬虫模式比较：

1、requests和beautifulsoup都是库，scrapy是框架。

2、scrapy框架中可以加入requests和beautifulsoup。

3、scrapy基于twisted，性能是最大的优势。

4、scrapy方便扩展，提供了很多内置的功能。

5、scrapy内置的css和xpath selector非常方便，beautifulsoup最大的缺点就是慢。

爬虫能做什么？

1、搜索引擎---百度、谷歌、垂直搜索引擎。

2、推荐引擎---今日头条

3、机器学习数据样本

5、数据分析（如金融数据分析）、舆情分析等。

网页分类：

常见类型的服务：

1、静态网页

2、动态网页

3、webservice（restapi）

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 为什么要使用scrapy而不是requests+beautifulsoup？ requests+BeautifulSoup详解 Python requests+BeautifulSoup爬虫（下载图片） python3 爬虫（requests+BeautifulSoup） requests+BeautifulSoup | 爬取电影天堂全站电影资源 python 爬虫 requests+BeautifulSoup 爬取巨潮资讯公司概况代码实例 python 爬虫（一） requests+BeautifulSoup 爬取简单网页代码示例使用python抓取并分析数据—链家网(requests+BeautifulSoup)（转）爬虫四大金刚：requests，selenium，BeautifulSoup，Scrapy requests和BeautifulSoup模块的使用