原文:Kaggle竞赛 —— 泰坦尼克号(Titanic)

完整代码见kaggle kernel或 GitHub 比赛页面:https: www.kaggle.com c titanic Titanic大概是kaggle上最受欢迎的项目了,有 多支队伍参加,多年来诞生了无数关于该比赛的经验分享。正是由于前人们的无私奉献,我才能无痛完成本篇。 事实上kaggle上的很多kernel都聚焦于某个特定的层面 比如提取某个不为人知的特征 使用超复杂的算法 专做E ...

2017-08-10 12:57 0 2078 推荐指数:

查看详情

Kaggle泰坦尼克号案例

1、数据来源 (1)数据来源 来自kaggle的数据集TitanicTitanic: Machine Learning from Disaster train文档数据是用来分析和建模,包含有生存情况信息;test数据是用来最终预测其生存情况并生成结果文件。 2、分析流程 (1)不同变量 ...

Sat Jun 09 00:14:00 CST 2018 1 6547
Kaggle入门——泰坦尼克号生还者预测

前言   这个是Kaggle比赛中泰坦尼克号生存率的分析。强烈建议在做这个比赛的时候,再看一遍电源《泰坦尼克号》,可能会给你一些启发,比如妇女儿童先上船等。所以是否获救其实并非随机,而是基于一些背景有先后顺序的。 1,背景介绍   1912年4月15日,载着1316乘客和891名船员的豪华 ...

Wed Apr 22 19:42:00 CST 2020 0 2640
Kaggle泰坦尼克号生存情况预测

Kaggle 是一个流行的数据科学竞赛平台 一、机器学习的基本步骤 二、提出问题 什么样的人更容易生存? 三、理解数据 3.1数据来源 https://www.kaggle.com/c/titanic 分为 训练集:train.csv,891条数据 测试 ...

Thu Dec 26 07:08:00 CST 2019 0 568
kaggle 泰坦尼克号问题总结

学习了机器学习这么久,第一次真正用机器学习中的方法解决一个实际问题,一步步探索,虽然最后结果不是很准确,仅仅达到了0.78647,但是真是收获很多,为了防止以后我的记忆虫上脑,我决定还是记录下来好了。 ...

Wed Jun 07 18:26:00 CST 2017 0 4070
泰坦尼克号沉没之谜,用数据还原真相——Titanic获救率分析(用pyecharts)

泰坦尼克号获救率数据分析报告,用数据揭露真相。 一,船上乘客生存率分析报告 泰坦尼克号生存率仅有38%的,可见此次事件救援不力,救生艇严重不足,且泰坦尼克号撞得是冰山,海水冷,没有救生艇,在水里冻死的乘客不少。 二,哪个年龄段存活率最高(青年人(18岁以下),中年人(18到50岁 ...

Sat Sep 22 19:56:00 CST 2018 1 3733
泰坦尼克号之灾分析

大神经验: 1、 应用机器学习,千万不要一上来就试图做到完美,先撸一个baseline的model出来,再进行后续的分析步骤,一步步提高,所谓后续步骤可能包括『分析model现在的状态(欠/过拟合 ...

Sat Aug 18 19:41:00 CST 2018 1 1185
泰坦尼克号幸存预测

本次项目主要围绕Kaggle上的比赛题目: "给出泰坦尼克号上的乘客的信息, 预测乘客是否幸存" 进行数据分析 环境 win8, python3.7, jupyter notebook 目录 1. 项目背景 2. 数据概览 3. 特征分析 4. 特征工程 5. 构建模型 正文 ...

Thu Oct 25 01:37:00 CST 2018 2 5148
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM