原文:泰坦尼克号之灾分析

大神经验: 应用机器学习,千万不要一上来就试图做到完美,先撸一个baseline的model出来,再进行后续的分析步骤,一步步提高,所谓后续步骤可能包括 分析model现在的状态 欠 过拟合 ,分析我们使用的feature的作用大小,进行feature selection,以及我们模型下的bad case和产生的原因 等等。 对数据的认识太重要了 数据中的特殊点 离群点的分析和处理太重要了 特征工 ...

2018-08-18 11:41 1 1185 推荐指数:

查看详情

泰坦尼克号生存预测分析

此文发表在简书,复制过来,在下方放上链接。 https://www.jianshu.com/p/a09b4dc904c9 泰坦尼克号生存预测 1.背景与挖掘目标 “泰坦尼克号”的沉没是历史上最臭名昭著的海难之一。1912年4月15日,泰坦尼克号在处女航中与冰山相撞后沉没,2224名乘客 ...

Thu Oct 10 06:51:00 CST 2019 0 562
泰坦尼克号幸存预测

本次项目主要围绕Kaggle上的比赛题目: "给出泰坦尼克号上的乘客的信息, 预测乘客是否幸存" 进行数据分析 环境 win8, python3.7, jupyter notebook 目录 1. 项目背景 2. 数据概览 3. 特征分析 4. 特征工程 5. 构建模型 正文 ...

Thu Oct 25 01:37:00 CST 2018 2 5148
Kaggle泰坦尼克号案例

1、数据来源 (1)数据来源 来自kaggle的数据集Titanic:Titanic: Machine Learning from Disaster train文档数据是用来分析和建模,包含有生存情况信息;test数据是用来最终预测其生存情况并生成结果文件。 2、分析流程 (1)不同变量 ...

Sat Jun 09 00:14:00 CST 2018 1 6547
数据分析-kaggle泰坦尼克号生存率分析

概述 1912年4月15日,泰坦尼克号在首次航行期间撞上冰山后沉没,2224名乘客和机组人员中有1502人遇难。沉船导致大量伤亡的原因之一是没有足够的救生艇给乘客和船员。虽然幸存下来有一些运气因素,但有一些人比其他人更有可能生存,比如妇女,儿童和上层阶级。在本文中将对哪些人 ...

Wed Apr 03 04:42:00 CST 2019 0 2332
泰坦尼克号沉没之谜,用数据还原真相——Titanic获救率分析(用pyecharts)

泰坦尼克号获救率数据分析报告,用数据揭露真相。 一,船上乘客生存率分析报告 泰坦尼克号生存率仅有38%的,可见此次事件救援不力,救生艇严重不足,且泰坦尼克号撞得是冰山,海水冷,没有救生艇,在水里冻死的乘客不少。 二,哪个年龄段存活率最高(青年人(18岁以下),中年人(18到50岁 ...

Sat Sep 22 19:56:00 CST 2018 1 3733
Kaggle泰坦尼克号生存情况预测

Kaggle 是一个流行的数据科学竞赛平台 一、机器学习的基本步骤 二、提出问题 什么样的人更容易生存? 三、理解数据 3.1数据来源 https://www.k ...

Thu Dec 26 07:08:00 CST 2019 0 568
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM