原文:【决策树】泰坦尼克号幸存者预测项目

项目目标 泰坦尼克号的沉没是历史上最著名的还难事件之一,在船上的 名乘客和机组人员中,共造成 人死亡。本次项目的目标是运用机器学习工具来预测哪些乘客能够幸免于难。 项目过程 导入并探索数据 处理缺失值,删除与预测无关的特征 将分类变量转换为数值型变量 实例化模型并进行交叉验证 模型预测 调参,得到最好的超参数 项目代码 Jupyter ...

2021-02-21 14:24 0 418 推荐指数:

查看详情

泰坦尼克号幸存预测

本次项目主要围绕Kaggle上的比赛题目: "给出泰坦尼克号上的乘客的信息, 预测乘客是否幸存" 进行数据分析 环境 win8, python3.7, jupyter notebook 目录 1. 项目背景 2. 数据概览 3. 特征分析 4. 特征工程 5. 构建模型 正文 ...

Thu Oct 25 01:37:00 CST 2018 2 5148
决策树泰坦尼克号实战

决策树分类的应用场景非常广泛,在各行各业都有应用,比如在金融行业可以用决策树做贷款风险评估,医疗行业可以用决策树生成辅助诊断,电商行业可以用决策树对销售额进行预测等。 基于决策树还诞生了很多数据挖掘算法,比如随机森林(Random forest)。 sklearn 中的决策树模型 到目前为止 ...

Mon Apr 08 04:03:00 CST 2019 0 841
决策树泰坦尼克号乘客的生存预测

前言 前些天学习了一下决策树算法(ID3、C4.5、cart算法),今天实际练习一下。 数据集、测试集地址: https://github.com/cystanford/Titanic_Data 原始数据: train.csv 是训练数据集,包含特征信息和存活与否的标签 ...

Thu Nov 14 06:53:00 CST 2019 0 897
用不同方法在R中进行泰坦尼克号幸存者预测练习

现有数据维度:PassengerId survival 生存 0 = No, 1 = Yespclass 票类 社会经济地位,1 = Upper, 2 = Middle, 3 = Lowersex 性别 Age 年龄 sibsp 兄弟姐妹/配偶在泰坦尼克号上 parch 父母/孩子在泰坦尼克号 ...

Tue Jul 25 01:30:00 CST 2017 0 1739
决策树算法6-案例:泰坦尼克号乘客生存预测

1 案例背景 泰坦尼克号沉没是历史上最臭名昭着的沉船之一。1912年4月15日,在她的处女航中,泰坦尼克号在与冰山相撞后沉没,在2224名乘客和机组人员中造成1502人死亡。这场耸人听闻的悲剧震惊了国际社会,并为船舶制定了更好的安全规定。 造成海难失事的原因之一是乘客和机组人员没有足够的救生艇 ...

Fri Sep 24 05:29:00 CST 2021 0 208
Kaggle入门——泰坦尼克号生还者预测

前言   这个是Kaggle比赛中泰坦尼克号生存率的分析。强烈建议在做这个比赛的时候,再看一遍电源《泰坦尼克号》,可能会给你一些启发,比如妇女儿童先上船等。所以是否获救其实并非随机,而是基于一些背景有先后顺序的。 1,背景介绍   1912年4月15日,载着1316乘客和891名船员的豪华 ...

Wed Apr 22 19:42:00 CST 2020 0 2640
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM