原作者:陈成龙 https://github.com/ChenglongChen 简介 Kaggle 于 2010 年创立,专注数据科学,机器学习竞赛的举办,是全球最大的数据科学社区和数据竞赛平台。笔者从 2013 年开始,陆续参加了多场 Kaggle上面举办的比赛,相继获得了 ...
数据挖掘 非常火爆的一个话题,跟大数据结合的模式也是赚足了噱头,工业界各土豪公司也是砸下重金网罗各种数据挖掘 机器学习人才。如今掌握一门挖掘技巧的实用性跟急迫性。在学习的过程中,除了相关理论的学习之外,最重要的就是如何把理论用于实践,当然做项目是最直接有效的实践方式,除此之外,参加一些数据挖掘比赛也是非常不错的经历,比赛过程中,我们不仅能加深模型 算法的学习,也能从别的参赛队员中学习他们的技巧。 ...
2014-11-24 12:14 13 30512 推荐指数:
原作者:陈成龙 https://github.com/ChenglongChen 简介 Kaggle 于 2010 年创立,专注数据科学,机器学习竞赛的举办,是全球最大的数据科学社区和数据竞赛平台。笔者从 2013 年开始,陆续参加了多场 Kaggle上面举办的比赛,相继获得了 ...
完整代码: https://github.com/cindycindyhi/kaggle-Titanic 特征工程系列: Titanic系列之原始数据分析和数据处理 Titanic系列之数据变换 Titanic系列之派生属性&维归约 缺失值填充之后,就要对其他格式有问题的属性进行 ...
【说在前面】本人博客新手一枚,象牙塔的老白,职业场的小白。以下内容仅为个人见解,欢迎批评指正,不喜勿喷![握手][握手] 1. 数据预处理 1.1 选择数据样本(企业级应用) 例如客观选择某一时间段内的所有样本集合等(避免人为主观选择) 例如在评价样本中去除恶意/随意评价样本 ...
一、单个特征的EDA 对于 binary feature 和 categorical feature,train['feature_name'].value_counts().sort_in ...
先看这个 kaggle数据集下载 -------------------------------- 有时发现下载不了kaggle数据 关于kaggle没有办法下载数据集dataset问题 安装kaggle库时又出现time out的情况? pip 下载报"connection ...
从百度搜索,净是csdn下载的,现在csdn下载弄的很恶心,垄断并且只想赚钱了,不想使用, 去github上找到了。 https://github.com/PacktPublishing/Lear ...
用户画像-数据挖掘项目实战 一,典型课题研究 用户画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。我们在实际操作的过程中往往会以最为浅显和贴近生活的话语将用户的属性、行为与期待的数据转化联结起来。作为实际用户的虚拟代表,用户画像 ...
《数据挖掘:R语言实战》 基本信息 作者: 黄文 王正林 丛书名: 大数据时代的R语言 出版社:电子工业出版社 ISBN:9787121231223 上架时间:2014-6-6 出版日期:2014 年6月 开本:16开 页码:292 版次:1-1 所属分类:计算机 ...