原文:数据挖掘工具分析北京房价 (一) 数据爬取采集

一. 前言 房价永远是最让人头疼且激动的话题,尤其是在帝都,多少人一辈子都为了一套房子打拼。正好我也想用一个大家比较关心的话题作为案例,把目前我开发的这套软件进行一次完整的演练。从数据采集,到清洗,分析,和最终可视化和报告的呈现,实现一次完整的流程。一方面可以给大家切实的分享一些有用的信息,再者可以更好地了解这套软件的使用流程。 关于本工具的介绍,可参考数据挖掘平台介绍 综述 平台简介。 自然的 ...

2014-09-01 21:03 3 10155 推荐指数:

查看详情

自制数据挖掘工具分析北京房价 (二) 数据清洗

上一节我们通过爬虫工具取了近七万条二手房数据,那么这一节就对这些数据进行预处理,也就是所谓的ETL(Extract-Transform-Load) 一.ETL工具的必要性 数据分析的前提是数据清洗。不论如何高大上的算法,遇到 ...

Tue Sep 02 05:05:00 CST 2014 1 3040
数据说话:北京房价数据背后的数据

从2014年对楼市的普遍唱衰,到2015年的价格回暖,到底发生了怎样的改变?本文就尝试通过大数据来和丰富的图表,为大家展现数据背后的数据数据采集采用笔者用C#开发的爬虫工具数据清洗ETL采用了笔者开发的工具 ...

Mon Nov 02 17:34:00 CST 2015 21 11749
python淘宝商品做数据挖掘

项目内容:   本项目选择 淘宝商品类目:零食 数量:一共100页,4400个零食商品 筛选条件:天猫、销量从高到低、价格0元到200元以内 项目目的: 对商品标题进行文本分析以及词云可视化 商品价格分布情况分析 商品的销量分布情况 ...

Wed May 08 08:00:00 CST 2019 0 5458
使用sklearn进行数据挖掘-房价预测(1)

使用sklearn进行数据挖掘系列文章: 1.使用sklearn进行数据挖掘-房价预测(1) 2.使用sklearn进行数据挖掘-房价预测(2)—划分测试集 3.使用sklearn进行数据挖掘-房价预测(3)—绘制数据的分布 4.使用sklearn进行数据挖掘-房价预测 ...

Wed Oct 25 05:03:00 CST 2017 0 5964
房价+数据可视化

/" 2.主题式网络爬虫的内容与数据特征分析 该网站的房价以及对应城市的人口,出生率,工人工 ...

Sat Dec 25 00:14:00 CST 2021 1 1476
数据挖掘——回归分析

回归分析(Regerssion Analysis) ——研究自变量与因变量之间关系形式的分析方法,它主要是通过建立因变量y 与影响他的自变量Xi 之间的回归模型,来预测因变量y 的发展趋势。 一、回归分析的分类 线性回归分析 简单线性回归分析 多重线性回归分析 ...

Fri Oct 05 03:38:00 CST 2018 0 2137
数据挖掘优秀工具对比

1、数据挖掘工具对比 数据来源:Top 15 Best Free Data Mining Tools: The Most Comprehensive List — Software Testing Help 2、Rapid Miner 3、Orange 4、Weka 4.1 介绍 ...

Tue Jul 31 02:01:00 CST 2018 0 1883
python北京贝壳找房网数据

                         python北京贝壳找房网数据 一,选题背景   贝壳找房业务涉及二手房,新房,租房,商业办公等。平台拥有全面真实的房源信息,为需要找房的人提高安全可靠的购房体验。对北京贝壳找房网进行数据   要达到的数据分析的预期目标 ...

Fri Jun 18 08:47:00 CST 2021 0 360
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM