python爬取豆瓣电影top250数据存入excel

本文转载自查看原文 2019-08-14 01:04 588 python爬虫

# -*- coding:utf-8 -*-
"""获取时光影评电影"""
import requests from bs4 import BeautifulSoup from datetime import datetime,timedelta import pymysql #xlwt-1.3.0 #from xlwt.xlwt import *
from xlwt import *
#获取指定开始排行的电影url
def get_url(root_url,start): return root_url+"?start="+str(start)+"&"

def get_review(page_url): """获取电影相关的信息""" movies_list = [] reponse = requests.get(page_url) soup =BeautifulSoup(reponse.text,'lxml') soup = soup.find("ol","grid_view") dict ={} for tag_li in soup.find_all("li"): dict = {} dict['rank'] = tag_li.find("em").string dict['title'] = tag_li.find_all("span","title")[0].string dict['score'] = tag_li.find("span","rating_num").string if tag_li.find("span","inq"): dict['desc'] =tag_li.find("span","inq").string else: dict['desc'] = '无评词' movies_list.append(dict) return movies_list def save_excel(movies_list): keys ="" w = Workbook() ws = w.add_sheet("movies") for i in movies_list: keys = list(i.keys()) for i in range(len(keys)): ws.write(0,i,keys[i]) for movies in range(len(movies_list)): for key,value in movies_list[movies].items(): keys = list(movies_list[movies].keys()) #找到key的index
            ws.write(movies+1,keys.index(key),value) w.save("movies.xls") if __name__ == '__main__': root_url = "https://movie.douban.com/top250" start =0 movies_list =get_review(get_url(root_url,start)) save_excel(movies_list)

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 python爬取豆瓣电影top250数据存入数据库爬取豆瓣电影Top250 Python爬虫——爬取豆瓣电影Top250 python3 爬虫---爬取豆瓣电影TOP250 python2.7爬取豆瓣电影top250并写入到TXT，Excel，MySQL数据库 Scrapy项目 - 数据简析 - 实现豆瓣 Top250 电影信息爬取的爬虫设计 Python爬虫——爬取豆瓣top250完整代码爬取豆瓣读书top250 豆瓣TOP250爬取及分析 [Python] 豆瓣电影top250爬虫