我的第一个python爬虫：爬取豆瓣top250前100部电影

本文转载自查看原文 2018-10-31 10:50 718 爬虫/ Python

爬取豆瓣top250前100部电影

 1 # -*-coding=UTF-8 -*-
 2 
 3 import requests
 4 from bs4 import BeautifulSoup
 5 
 6     headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36',
 7                'Host': 'movie.douban.com'}
 8     movie_list = {}
 9    
10     for i in range(0,4):
11         link = 'https://movie.douban.com/top250?start='+ str(i*25)+ '&filter='
12         r = requests.get(link,headers=headers,timeout=10)
13         print(str(i+1),'states:',r.status_code)
14         # print(r.text)
15         soup = BeautifulSoup(r.text,"lxml")
16         div_list = soup.find_all('div',class_="info")
17     
18         for each in div_list:
19             name =  each.div.a.span.text.strip()
20             info =  each.p.text.strip()
21             
22             movie_list[name]=info
23         
24     return movie_list
25 
26 movies = get_movies()
27 
28 with open('douban.txt','w',encoding='utf-8') as f:
29     for  k in movies:
30         f.write(str('\n'+k+' :: '+ movies[k] +'\n\n'+'-------------------------'+'\n\n'))
31     f.close()
32     print('Finished!!!')

输出结果截图：

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 python爬取豆瓣电影top250 python爬取豆瓣top250电影源码 python3爬虫-6.使用requests和BeautifulSoup爬取豆瓣Top250电影 Python-爬虫实战简单爬取豆瓣top250电影保存到本地 Python爬虫-爬取豆瓣图书Top250 Python爬虫实例：爬取豆瓣Top250 爬取豆瓣电影排行top250 scrapy爬虫框架教程（二）-- 爬取豆瓣电影TOP250 Scrapy项目 - 实现豆瓣 Top250 电影信息爬取的爬虫设计 [151116 记录] 使用Python3.5爬取豆瓣电影Top250