1、数据来源 (1)数据来源 来自kaggle的数据集Titanic:Titanic: Machine Learning from Disaster train文档数据是用来分析和建模,包含有生存情况信息;test数据是用来最终预测其生存情况并生成结果文件。 2、分析流程 (1)不同变量 ...
参考Kernels里面评论较高的一篇文章,整理作者解决整个问题的过程,梳理该篇是用以了解到整个完整的建模过程,如何思考问题,处理问题,过程中又为何下那样或者这样的结论等 最后得分并不是特别高,只是到 ,更多是整理一个解决问题的思路,另外前面三个大步骤根据思维导图看即可,代码跟文字等从第四个步骤开始写起。 会用到的库: 以下是在接下来的实验里会用到的一些库: 获取数据: 我们可以用python 的P ...
2018-09-24 14:23 5 8984 推荐指数:
1、数据来源 (1)数据来源 来自kaggle的数据集Titanic:Titanic: Machine Learning from Disaster train文档数据是用来分析和建模,包含有生存情况信息;test数据是用来最终预测其生存情况并生成结果文件。 2、分析流程 (1)不同变量 ...
也不知道对不对,就凭着自己的思路写了一个 数据集:https://www.kaggle.com/c/titanic/data 效果一般吧,不过至少出来了,hiahiahia ...
前言 这个是Kaggle比赛中泰坦尼克号生存率的分析。强烈建议在做这个比赛的时候,再看一遍电源《泰坦尼克号》,可能会给你一些启发,比如妇女儿童先上船等。所以是否获救其实并非随机,而是基于一些背景有先后顺序的。 1,背景介绍 1912年4月15日,载着1316号乘客和891名船员的豪华 ...
Kaggle 是一个流行的数据科学竞赛平台 一、机器学习的基本步骤 二、提出问题 什么样的人更容易生存? 三、理解数据 3.1数据来源 https://www.kaggle.com/c/titanic 分为 训练集:train.csv,891条数据 测试 ...
原文地址如下: https://www.kaggle.com/startupsci/titanic-data-science-solutions ---------------------------------------------------------------- 泰坦尼克 ...
机器学习系列(3)_逻辑回归应用之Kaggle泰坦尼克之灾 标签: 机器学习应用 2015-11-12 13:52 3688人阅读 评论(15) 收藏 举报 本文章已收录于: 机器学习知识库 分类 ...
学习了机器学习这么久,第一次真正用机器学习中的方法解决一个实际问题,一步步探索,虽然最后结果不是很准确,仅仅达到了0.78647,但是真是收获很多,为了防止以后我的记忆虫上脑,我决定还是记录下来好了。 1,看到样本是,查看样本的分布和统计情况 通常遇到缺值的情况,我们会有几种常见 ...
完整代码见kaggle kernel 或 GitHub 比赛页面:https://www.kaggle.com/c/titanic Titanic大概是kaggle上最受欢迎的项目了,有7000多支队伍参加,多年来诞生了无数关于该比赛的经验分享。正是由于前人 ...