前言 前些天学习了一下决策树算法(ID3、C4.5、cart算法),今天实际练习一下。 数据集、测试集地址: https://github.com/cystanford/Titanic_Data 原始数据: train.csv 是训练数据集,包含特征信息和存活与否的标签 ...
决策树分类的应用场景非常广泛,在各行各业都有应用,比如在金融行业可以用决策树做贷款风险评估,医疗行业可以用决策树生成辅助诊断,电商行业可以用决策树对销售额进行预测等。 基于决策树还诞生了很多数据挖掘算法,比如随机森林 Random forest 。 sklearn 中的决策树模型 到目前为止,sklearn 中只实现了 ID 与 CART决策树,所以我们暂时只能使用这两种决策树,在构造 Decis ...
2019-04-07 20:03 0 841 推荐指数:
前言 前些天学习了一下决策树算法(ID3、C4.5、cart算法),今天实际练习一下。 数据集、测试集地址: https://github.com/cystanford/Titanic_Data 原始数据: train.csv 是训练数据集,包含特征信息和存活与否的标签 ...
项目目标 泰坦尼克号的沉没是历史上最著名的还难事件之一,在船上的2224名乘客和机组人员中,共造成1502人死亡。本次项目的目标是运用机器学习工具来预测哪些乘客能够幸免于难。 项目过程 导入并探索数据 处理缺失值,删除与预测无关的特征 将分类变量转换为数值型变量 实例化 ...
1 案例背景 泰坦尼克号沉没是历史上最臭名昭着的沉船之一。1912年4月15日,在她的处女航中,泰坦尼克号在与冰山相撞后沉没,在2224名乘客和机组人员中造成1502人死亡。这场耸人听闻的悲剧震惊了国际社会,并为船舶制定了更好的安全规定。 造成海难失事的原因之一是乘客和机组人员没有足够的救生艇 ...
使用python3 学习了决策树分类器的api 涉及到 特征的提取,数据类型保留,分类类型抽取出来新的类型 需要网上下载数据集,我把他们下载到了本地, 可以到我的git下载代码和数据集: https://github.com/linyi0604/MachineLearning ...
一,典型课题研究 建立一个预测模型来回答以下问题:“什么样的人更有可能生存? 二,数据 1,数据源:https://www.kaggle.com/c/titanic ...
...
大神经验: 1、 应用机器学习,千万不要一上来就试图做到完美,先撸一个baseline的model出来,再进行后续的分析步骤,一步步提高,所谓后续步骤可能包括『分析model现在的状态(欠/过拟合 ...
本次项目主要围绕Kaggle上的比赛题目: "给出泰坦尼克号上的乘客的信息, 预测乘客是否幸存" 进行数据分析 环境 win8, python3.7, jupyter notebook 目录 1. 项目背景 2. 数据概览 3. 特征分析 4. 特征工程 5. 构建模型 正文 ...