前言
利用Python爬取房价信息并进行简单的数据分析
Ok,让我们开始吧~~~
开发工具
Python版本:3.6.4
相关模块:
openpyxl模块;
requests模块;
bs4模块;
pyecharts模块;
以及一些python自带的模块。
环境搭建
安装Python并添加到环境变量,pip安装需要的相关模块即可。
pyecharts模块安装可参考:
原理简介
需求:
根据输入的城市名获取该城市的房价信息;
对获得的数据进行简单的分析。
目标网站:
链家网(https://dl.lianjia.com/)
目标数据(图中圈出的):
实现思路:
很基础的爬虫,不需要任何分析。直接请求需要的网页地址,然后利用bs4模块解析请求返回的数据并获取所需的信息即可。
然后再对这些信息进行简单的分析。
其中信息保存到Excel中,分析时读取即可。
数据分析
以北京为例:
北京房价(元/平方):
北京房价(万元/套起):
参考:详细参考
Python系列爬虫之Scrapy实战 | 抓取并分析天气数据
文章到这里就结束了,感谢你的观看,关注我每天分享Python爬虫实战系列,下篇文章分享爬取携程旅游景点数据爬取与可视化。