原文:爬取豆瓣电影信息

昨天写了一个小爬虫,爬取了豆瓣上 年中国大陆的电影信息,网址为豆瓣选影视,爬取了电影的名称 导演 编剧 主演 类型 上映时间 片长 评分和链接,并保存到MongoDB中。 一开始用的本机的IP地址,没用代理IP,请求了十几个网页之后就收不到数据了,报HTTP错误 ,然后用浏览器打开网页试了一下,发现浏览器也是 。。。 但是我不怕,我有代理IP,哈哈哈 详见我前一篇随笔:爬取代理IP。 使用代理IP ...

2018-12-10 13:00 0 1597 推荐指数:

查看详情

scrapy豆瓣电影信息

最近在学python,对python爬虫框架十分着迷,因此在网上看了许多大佬们的代码,经过反复测试修改,终于大功告成! 原文地址是:https://blog.csdn.net/ljm_9615/ar ...

Fri Jun 01 00:53:00 CST 2018 0 816
python豆瓣电影信息数据

题外话+ 大家好啊,最近自己在做一个属于自己的博客网站(准备辞职回家养老了,明年再战)在家里 琐事也很多, 加上自己 一回到家就懒了(主要是家里冷啊! 广东十几度,老家几度,躲在被窝瑟瑟发抖,) ...

Sat Dec 29 00:06:00 CST 2018 0 4988
豆瓣电影

一、任务描述   https://movie.douban.com/tag/#/豆瓣电影,选择电影,中国大陆,2018年,按评分最高,前200部,保存电影名称,图片链接,和电影评分。   由于网页是动态加载,每页显示20条,每一页的网址是变化的,需要去网页上查看网址。   打开 ...

Mon Jun 17 06:35:00 CST 2019 0 1260
1-1 用Python豆瓣及IMDB上的电影信息

下面的代码可以抓取豆瓣及IMDB上的电影信息,由于每段代码使用的数据源自上一段代码输出的数据,所以需要按顺序执行。 step1_getDoubanMovies.py step2_getScore.py ...

Tue May 17 01:54:00 CST 2016 1 1612
Python爬虫入门 | 豆瓣电影信息

这是一个适用于小白的Python爬虫免费教学课程,只有7节,让零基础的你初步了解爬虫,跟着课程内容能自己资源。看着文章,打开电脑动手实践,平均45分钟就能学完一节,如果你愿意,今天内你就可以迈入爬虫的大门啦~ ps注意:很多人学Python过程中会遇到各种烦恼问题,没有人帮答疑容易放弃。为此 ...

Thu Mar 12 21:36:00 CST 2020 0 1933
Python豆瓣电影top

Python豆瓣电影top250 下面以四种方法去解析数据,前面三种以插件库来解析,第四种以正则表达式去解析。 xpath pyquery beaufifulsoup re 信息:名称 评分 小评 结果显示 使用xpath ...

Sun Aug 18 21:32:00 CST 2019 0 1028
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM