原文:Kaggle泰坦尼克号案例

数据来源 数据来源 来自kaggle的数据集Titanic:Titanic: Machine Learning from Disaster train文档数据是用来分析和建模,包含有生存情况信息 test数据是用来最终预测其生存情况并生成结果文件。 分析流程 不同变量跟生存情况的关系分析 查看缺失值并对缺失值进行处理 建立模型并预测 提交预测结果,查看网站排名。 数据分析 载入文件: 可以看到所 ...

2018-06-08 16:14 1 6547 推荐指数:

查看详情

Kaggle入门——泰坦尼克号生还者预测

前言   这个是Kaggle比赛中泰坦尼克号生存率的分析。强烈建议在做这个比赛的时候,再看一遍电源《泰坦尼克号》,可能会给你一些启发,比如妇女儿童先上船等。所以是否获救其实并非随机,而是基于一些背景有先后顺序的。 1,背景介绍   1912年4月15日,载着1316乘客和891名船员的豪华 ...

Wed Apr 22 19:42:00 CST 2020 0 2640
Kaggle泰坦尼克号生存情况预测

Kaggle 是一个流行的数据科学竞赛平台 一、机器学习的基本步骤 二、提出问题 什么样的人更容易生存? 三、理解数据 3.1数据来源 https://www.kaggle.com/c/titanic 分为 训练集:train.csv,891条数据 测试 ...

Thu Dec 26 07:08:00 CST 2019 0 568
kaggle 泰坦尼克号问题总结

学习了机器学习这么久,第一次真正用机器学习中的方法解决一个实际问题,一步步探索,虽然最后结果不是很准确,仅仅达到了0.78647,但是真是收获很多,为了防止以后我的记忆虫上脑,我决定还是记录下来好了。 ...

Wed Jun 07 18:26:00 CST 2017 0 4070
Kaggle竞赛 —— 泰坦尼克号(Titanic)

完整代码见kaggle kernel 或 GitHub 比赛页面:https://www.kaggle.com/c/titanic Titanic大概是kaggle上最受欢迎的项目了,有7000多支队伍参加,多年来诞生了无数关于该比赛的经验分享。正是由于前人 ...

Thu Aug 10 20:57:00 CST 2017 0 2078
泰坦尼克号之灾分析

大神经验: 1、 应用机器学习,千万不要一上来就试图做到完美,先撸一个baseline的model出来,再进行后续的分析步骤,一步步提高,所谓后续步骤可能包括『分析model现在的状态(欠/过拟合 ...

Sat Aug 18 19:41:00 CST 2018 1 1185
泰坦尼克号幸存预测

本次项目主要围绕Kaggle上的比赛题目: "给出泰坦尼克号上的乘客的信息, 预测乘客是否幸存" 进行数据分析 环境 win8, python3.7, jupyter notebook 目录 1. 项目背景 2. 数据概览 3. 特征分析 4. 特征工程 5. 构建模型 正文 ...

Thu Oct 25 01:37:00 CST 2018 2 5148
数据分析-kaggle泰坦尼克号生存率分析

概述 1912年4月15日,泰坦尼克号在首次航行期间撞上冰山后沉没,2224名乘客和机组人员中有1502人遇难。沉船导致大量伤亡的原因之一是没有足够的救生艇给乘客和船员。虽然幸存下来有一些运气因素,但有一些人比其他人更有可能生存,比如妇女,儿童和上层阶级。在本文中将对哪些人 ...

Wed Apr 03 04:42:00 CST 2019 0 2332
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM