Excel操作-用excel实现爬取网站上表格数据


 

 

  • Excel下,数据-获取数据-自网站输入网站,即可选择想要抓取的数据。
  • 抓取数据要定期更新,可以找到刷新-链接属性,设置刷新频率。
  • 数据抓取需要网页自带表格,无表格则要用爬虫工具或更深入知识。 

 

获取豆瓣电影

  使用excel爬取豆瓣网 https://movie.douban.com/coming 即将要上映电影的数据,并快速将数据保存到excel单元格中。

  点击“数据-获取数据-自其他来源-自网站”或者直接点击"数据-自网站"。

 

 

获取股票实时行情

  这次要获取股票实时行情数据 http://q.10jqka.com.cn/

  相比获取豆瓣要上映电影有点不一样,获取股票实时行情需要每一分钟都要自动更新数据。

  同理我们和获取豆瓣电影即将上映电影数据操作一样

 

  将股票实时行情数据保存在excel数据表格中后,右击表格,可以看到表格中有个"刷新"按钮。可以通过点击"刷新"使excel重新获取网页上的表单数据。(学习的时候是晚上十点多,已经收市,点击刷新表格数据没有发生变化)

 

  可以通过"数据"-"全部刷新"-“链接属性”-"查询属性",设置excel自动刷新表单频率,就可以实现excel自动刷新表单上的数据。

 

 

  对比excel和爬虫一样的编程语言去爬取网站内上数据,excel有一个比较大的缺点,excel只能爬取网站上表格类型的数据,不能爬取结构化的数据。

 

 

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM