原文:用决策树做泰坦尼克号乘客的生存预测

前言 前些天学习了一下决策树算法 ID C . cart算法 ,今天实际练习一下。 数据集 测试集地址: https: github.com cystanford Titanic Data 原始数据: train.csv 是训练数据集,包含特征信息和存活与否的标签 test.csv: 测试数据集,只包含特征信息。 我们需要做的,就是使用训练集的数据,构建决策树,然后对测试集数据进行预测。 训练集中 ...

2019-11-13 22:53 0 897 推荐指数:

查看详情

决策树算法6-案例:泰坦尼克号乘客生存预测

1 案例背景 泰坦尼克号沉没是历史上最臭名昭着的沉船之一。1912年4月15日,在她的处女航中,泰坦尼克号在与冰山相撞后沉没,在2224名乘客和机组人员中造成1502人死亡。这场耸人听闻的悲剧震惊了国际社会,并为船舶制定了更好的安全规定。 造成海难失事的原因之一是乘客和机组人员没有足够的救生艇 ...

Fri Sep 24 05:29:00 CST 2021 0 208
决策树泰坦尼克号实战

决策树分类的应用场景非常广泛,在各行各业都有应用,比如在金融行业可以用决策树贷款风险评估,医疗行业可以用决策树生成辅助诊断,电商行业可以用决策树对销售额进行预测等。 基于决策树还诞生了很多数据挖掘算法,比如随机森林(Random forest)。 sklearn 中的决策树模型 到目前为止 ...

Mon Apr 08 04:03:00 CST 2019 0 841
决策树泰坦尼克号幸存者预测项目

项目目标 泰坦尼克号的沉没是历史上最著名的还难事件之一,在船上的2224名乘客和机组人员中,共造成1502人死亡。本次项目的目标是运用机器学习工具来预测哪些乘客能够幸免于难。 项目过程 导入并探索数据 处理缺失值,删除与预测无关的特征 将分类变量转换为数值型变量 实例化 ...

Sun Feb 21 22:24:00 CST 2021 0 418
Kaggle泰坦尼克号生存情况预测

Kaggle 是一个流行的数据科学竞赛平台 一、机器学习的基本步骤 二、提出问题 什么样的人更容易生存? 三、理解数据 3.1数据来源 https://www.kaggle.com/c/titanic 分为 训练集:train.csv,891条数据 测试 ...

Thu Dec 26 07:08:00 CST 2019 0 568
泰坦尼克号生存预测分析

此文发表在简书,复制过来,在下方放上链接。 https://www.jianshu.com/p/a09b4dc904c9 泰坦尼克号生存预测 1.背景与挖掘目标 “泰坦尼克号”的沉没是历史上最臭名昭著的海难之一。1912年4月15日,泰坦尼克号在处女航中与冰山相撞后沉没,2224名乘客 ...

Thu Oct 10 06:51:00 CST 2019 0 562
泰坦尼克号幸存预测

本次项目主要围绕Kaggle上的比赛题目: "给出泰坦尼克号上的乘客的信息, 预测乘客是否幸存" 进行数据分析 环境 win8, python3.7, jupyter notebook 目录 1. 项目背景 2. 数据概览 3. 特征分析 4. 特征工程 5. 构建模型 正文 ...

Thu Oct 25 01:37:00 CST 2018 2 5148
用Python随机森林预测泰坦尼克号生存情况

假期闲着无聊,做了一下Kaggle练手的项目--预测泰坦尼克号乘客的存活情况。对于一些函数和算法,刚开始也是懵懵懂懂的,但通过自己查资料,还是明白了许多。然后就是自己写的时候还看了下别人的做法,特别是国外的文章,写得很详细,逻辑特别清晰,还把不同算法的结果给你列出来,最后选择了最优算法。好佩服 ...

Sat Apr 07 12:00:00 CST 2018 0 8334
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM