原文:决策树算法6-案例:泰坦尼克号乘客生存预测

案例背景 泰坦尼克号沉没是历史上最臭名昭着的沉船之一。 年 月 日,在她的处女航中,泰坦尼克号在与冰山相撞后沉没,在 名乘客和机组人员中造成 人死亡。这场耸人听闻的悲剧震惊了国际社会,并为船舶制定了更好的安全规定。 造成海难失事的原因之一是乘客和机组人员没有足够的救生艇。尽管幸存下沉有一些运气因素,但有些人比其他人更容易生存,例如妇女,儿童和上流社会。 在这个案例中,我们要求您完成对哪些人可能存 ...

2021-09-23 21:29 0 208 推荐指数:

查看详情

决策树泰坦尼克号乘客生存预测

前言 前些天学习了一下决策树算法(ID3、C4.5、cart算法),今天实际练习一下。 数据集、测试集地址: https://github.com/cystanford/Titanic_Data 原始数据: train.csv 是训练数据集,包含特征信息和存活与否的标签 ...

Thu Nov 14 06:53:00 CST 2019 0 897
决策树泰坦尼克号实战

决策树分类的应用场景非常广泛,在各行各业都有应用,比如在金融行业可以用决策树做贷款风险评估,医疗行业可以用决策树生成辅助诊断,电商行业可以用决策树对销售额进行预测等。 基于决策树还诞生了很多数据挖掘算法,比如随机森林(Random forest)。 sklearn 中的决策树模型 到目前为止 ...

Mon Apr 08 04:03:00 CST 2019 0 841
决策树泰坦尼克号幸存者预测项目

项目目标 泰坦尼克号的沉没是历史上最著名的还难事件之一,在船上的2224名乘客和机组人员中,共造成1502人死亡。本次项目的目标是运用机器学习工具来预测哪些乘客能够幸免于难。 项目过程 导入并探索数据 处理缺失值,删除与预测无关的特征 将分类变量转换为数值型变量 实例化 ...

Sun Feb 21 22:24:00 CST 2021 0 418
泰坦尼克号生存预测分析

此文发表在简书,复制过来,在下方放上链接。 https://www.jianshu.com/p/a09b4dc904c9 泰坦尼克号生存预测 1.背景与挖掘目标 “泰坦尼克号”的沉没是历史上最臭名昭著的海难之一。1912年4月15日,泰坦尼克号在处女航中与冰山相撞后沉没,2224名乘客 ...

Thu Oct 10 06:51:00 CST 2019 0 562
Kaggle泰坦尼克号生存情况预测

Kaggle 是一个流行的数据科学竞赛平台 一、机器学习的基本步骤 二、提出问题 什么样的人更容易生存? 三、理解数据 3.1数据来源 https://www.kaggle.com/c/titanic 分为 训练集:train.csv,891条数据 测试 ...

Thu Dec 26 07:08:00 CST 2019 0 568
泰坦尼克号幸存预测

本次项目主要围绕Kaggle上的比赛题目: "给出泰坦尼克号上的乘客的信息, 预测乘客是否幸存" 进行数据分析 环境 win8, python3.7, jupyter notebook 目录 1. 项目背景 2. 数据概览 3. 特征分析 4. 特征工程 5. 构建模型 正文 ...

Thu Oct 25 01:37:00 CST 2018 2 5148
Kaggle泰坦尼克号案例

1、数据来源 (1)数据来源 来自kaggle的数据集Titanic:Titanic: Machine Learning from Disaster train文档数据是用来分析和建模,包含有生存情况信息;test数据是用来最终预测生存情况并生成结果文件。 2、分析流程 (1)不同变量 ...

Sat Jun 09 00:14:00 CST 2018 1 6547
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM