python爬取动态数据实战---猫眼专业版-实时票房（一）

本文转载自查看原文 2019-10-31 16:38 653 Python

学习了python之后，准备爬虫项目练练手。简单实现爬取网页数据的功能，发现猫眼实时票房展示的数据样本正好符合预期，就记录一下之间遇到的困难与解决办法

目标数据：其中绿色框是想要获取的数据种类，红色框是需要获取的具体数据

通过F12查看网页源代码，发现<table>标签里就是需要获取的数据

首先通过scrapy的shell命令：scrapy shell "http://piaofang.meituan.com/dashboard"

查看是否可以获取数据（本人就是在此处遇到了困难，造成无法获取动态加载的目标数据）

执行成功之后就进入了交互模式，可以获取网页的内容，

输入命令：response.xpath("//div/div/div[2]/div[2]/table").extract()

可以获取到数据的种类信息

通过命令:response.xpath("//div/div/div[2]/div[2]/div/div/table").extract()

获取不到数据的具体数值信息：返回的数据是空的

继续查看网页源代码，这些数据是实时加载的，发现数据存放在second-box这个xhr类型文件中，可以通过此处获取数据

注：XHR到底是什么可以参照这篇文章:https://www.cnblogs.com/dengyg200891/p/6564739.html）

选择-右击-可以选择复制链接地址：http://piaofang.meituan.com/second-box

单独打开这个页面地址就可以获取到实时票房数据了。

红色框等数据就是所需要的。只需要通过该地址获取数据即可

这时候再通过命令进入交互模式：scrapy shell "http://piaofang.meituan.com/second-box"

通过命令： response.body。查看到具体数据信息（中文不显示，但不妨碍获取数据）

以上就是爬取数据的流程步骤

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 python爬取动态数据实战---猫眼专业版-实时票房（二） Python3爬取起猫眼电影实时票房信息，解决文字反爬~~~附源代码实时爬取猫眼票房＋微信推送|作业3 1-2 用Python爬取猫眼票房网上的电影票房信息猫眼电影加密数字破解（爬取评分票房票价）记录python爬取猫眼票房排行榜(带stonefont字体网页),保存到text文件,csv文件和MongoDB数据库中 Python实战之如何爬取猫眼电影排行？本文详解 python 爬取猫眼电影top100数据 python实现爬取猫眼并初步分析数据一起学爬虫——使用xpath库爬取猫眼电影国内票房榜