原文:Kaggle入门Titanic——特征工程

,介绍 Titanic: Machine Learning from Disaster是kaggle比赛的入门训练,具体介绍可以看链接,数据在官网上下载,但需要注册登录。训练集在train.csv中,测试集在test.csv。这里对特征的处理主要是来自Sina的Titanic best working Classifier。 首先对训练集的信息进行了解,从中可以看出训练集有 个样本, 个特征,分 ...

2017-03-10 20:11 0 3063 推荐指数:

查看详情

kaggle入门2——改进特征

1:改进我们的特征 在上一个任务中,我们完成了我们在Kaggle上一个机器学习比赛的第一个比赛提交泰坦尼克号:灾难中的机器学习。 可是我们提交的分数并不是非常高。有三种主要的方法可以让我们能够提高他: 用一个更好的机器学习算法; 生成更好的特征; 合并多重机器学习算法 ...

Thu Jul 28 17:37:00 CST 2016 0 2089
Kaggle Titanic补充篇

1个,用最高频率值填充 特征工程:由于Fare分布非常不均,所以这里不用cut函数,而是 ...

Mon Oct 02 05:57:00 CST 2017 0 1592
kaggle Titanic心得

Titanickaggle上一个练手的比赛,kaggle平台提供一部分人的特征,以及是否遇难,目的是预测另一部分人是否遇难。目前抽工作之余,断断续续弄了点,成绩为0.79426。在这个比赛过程中,接触并了解了一些数据挖掘比赛的基本流程,现记录一下。 1. 分析数据 ...

Wed May 31 00:08:00 CST 2017 4 1258
kaggle数据挖掘竞赛初步--Titanic<随机森林&特征重要性>

完整代码: https://github.com/cindycindyhi/kaggle-Titanic 特征工程系列: Titanic系列之原始数据分析和数据处理 Titanic系列之数据变换 Titanic系列之派生属性&维归约 之前的三篇博文已经进行了一次还算完整的特征工程 ...

Tue Mar 24 00:13:00 CST 2015 4 10996
Titanic幸存预测分析(Kaggle)

分享一篇kaggle入门级案例,泰坦尼克号幸存遇难分析。 参考文章: 技术世界,原文链接 http://www.jasongj.com/ml/classification/ 案例分析内容: 通过训练集分析预测什么人可能生还,并对测试集中乘客做出预测判断 ...

Sun Dec 24 05:29:00 CST 2017 0 2043
Kaggle实战之Titanic: Machine Learning from Disaster

最近埋头苦读,啃机器学习的算法和编程,真是非(xiang)常(dang)欢(lan)乐(sou)呢~ 于是开始自我膨胀跃跃欲试。 嗯,那就从Kaggle的playground开始吧,找了个经典而又浪漫的爱情故事—泰坦尼克,应该能引起我的兴趣好好挖掘吧~ "You jump! I jump ...

Fri Dec 07 00:42:00 CST 2018 0 1036
我的第一个 Kaggle 比赛学习 - Titanic

背景 Titanic: Machine Learning from Disaster - Kaggle 2 年前就被推荐照着这个比赛做一下,结果我打开这个页面便蒙了,完全不知道该如何下手。 两年后,再次打开这个页面,看到清清楚楚的Titanic Tutorial - Kaggle,完全傻瓜式 ...

Sat Jan 25 21:30:00 CST 2020 0 286
Kaggle入门

Kaggle入门 1:竞赛 我们将学习如何为Kaggle竞赛生成一个提交答案(submisson)。Kaggle是一个你通过完成算法和全世界机器学习从业者进行竞赛的网站。如果你的算法精度是给出数据集中最高的,你将赢得比赛。Kaggle也是一个实践你机器学习技能的非常有趣的方式 ...

Sun Jul 31 05:43:00 CST 2016 0 3030
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM