原文:利用python进行泰坦尼克生存预测——数据探索分析

最近一直断断续续的做这个泰坦尼克生存预测模型的练习,这个kaggle的竞赛题,网上有很多人都分享过,而且都很成熟,也有些写的非常详细,我主要是在牛人们的基础上,按照数据挖掘流程梳理思路,然后通过练习每一步来熟悉应用python进行数据挖掘的方式。 数据挖掘的一般过程是:数据预览 gt 数据预处理 缺失值 离散值等 gt 变量转换 构造新的衍生变量 gt 数据探索 提取特征 gt 训练 gt 调优 ...

2018-05-25 00:03 0 3293 推荐指数:

查看详情

泰坦尼克生存预测分析

此文发表在简书,复制过来,在下方放上链接。 https://www.jianshu.com/p/a09b4dc904c9 泰坦尼克生存预测 1.背景与挖掘目标 “泰坦尼克号”的沉没是历史上最臭名昭著的海难之一。1912年4月15日,泰坦尼克号在处女航中与冰山相撞后沉没,2224名乘客 ...

Thu Oct 10 06:51:00 CST 2019 0 562
pytorch kaggle 泰坦尼克生存预测

也不知道对不对,就凭着自己的思路写了一个 数据集:https://www.kaggle.com/c/titanic/data 效果一般吧,不过至少出来了,hiahiahia ...

Sat Dec 15 00:41:00 CST 2018 0 1088
Kaggle泰坦尼克生存情况预测

Kaggle 是一个流行的数据科学竞赛平台 一、机器学习的基本步骤 二、提出问题 什么样的人更容易生存? 三、理解数据 3.1数据来源 https://www.kaggle.com/c/titanic 分为 训练集:train.csv,891条数据 测试 ...

Thu Dec 26 07:08:00 CST 2019 0 568
Python随机森林预测泰坦尼克生存情况

假期闲着无聊,做了一下Kaggle练手的项目--预测泰坦尼克号乘客的存活情况。对于一些函数和算法,刚开始也是懵懵懂懂的,但通过自己查资料,还是明白了许多。然后就是自己写的时候还看了下别人的做法,特别是国外的文章,写得很详细,逻辑特别清晰,还把不同算法的结果给你列出来,最后选择了最优算法。好佩服 ...

Sat Apr 07 12:00:00 CST 2018 0 8334
数据分析-kaggle泰坦尼克生存分析

概述 1912年4月15日,泰坦尼克号在首次航行期间撞上冰山后沉没,2224名乘客和机组人员中有1502人遇难。沉船导致大量伤亡的原因之一是没有足够的救生艇给乘客和船员。虽然幸存下来有一些运气因素,但有一些人比其他人更有可能生存,比如妇女,儿童和上层阶级。在本文中将对哪些人 ...

Wed Apr 03 04:42:00 CST 2019 0 2332
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM