1. 目的:根据人口普查数据来预测收入(预测每个个体年收入是否超过$50,000) 2. 数据来源:1994年美国人口普查数据,数据中共含31978个观测值,每个观测值代表一个个体 3. 变量介绍: (1)age: 年龄(以年表示) (2)workclass: 工作类别 ...
. 目的:根据银行客户信息,判断其是否接受银行向他们提供的个人贷款。 . 数据来源:https: www.kaggle.com lowecoryr universalbank . 数据介绍:数据中共包含 个观测值, 个变量。其中,每一个观测值代表一个客户。 bank.df lt read.csv UniversalBank.csv 读取数据 str bank.df 查看数据结构 View ban ...
2019-11-21 12:09 0 761 推荐指数:
1. 目的:根据人口普查数据来预测收入(预测每个个体年收入是否超过$50,000) 2. 数据来源:1994年美国人口普查数据,数据中共含31978个观测值,每个观测值代表一个个体 3. 变量介绍: (1)age: 年龄(以年表示) (2)workclass: 工作类别 ...
1. 目的:根据房子信息,判断博士顿地区的房价。 2. 数据来源:论文《Hedonic housing prices and the demand for clean air》,数据中共含50 ...
一、简介 决策树分类算法(decision tree)通过树状结构对具有某特征属性的样本进行分类。其典型算法包括ID3算法、C4.5算法、C5.0算法、CART算法等。每一个决策树包括根节点(root node),内部节点(internal node)以及叶子节点(leaf node)。 根 ...
benign malignant 329 160 benign malignant 129 81 Call:glm(formula = class ~ ., ...
目录 特征选择 信息的度量和作用 信息增益 信息增益的计算 常见决策树使用的算法 sklearn决策树API 泰坦尼克号案例 决策树的优缺点以及改进 集成学习方法-随机森林 学习算法 ...
CART:Classification and regression tree,分类与回归树。(是二叉树) CART是决策树的一种,主要由特征选择,树的生成和剪枝三部分组成。它主要用来处理分类和回归问题,下面对分别对其进行介绍。 1、回归树:使用平方误差最小准则 训练集为:D={(x1,y1 ...
朴素贝叶斯分类(naive bayesian,nb)源于贝叶斯理论,其基本思想:假设样本属性之间相互独立,对于给定的待分类项,求解在此项出现的情况下其他各个类别出现的概率,哪个最大,就认为待分类项属于那一类别。邮箱内垃圾邮件的筛选即应用朴素贝叶斯算法。 朴素贝叶斯分类实现的三阶 ...
第一章 R语言介绍 读取,设置当前工作区 setwd("E:\\Desktop\\R Language\\R") getwd() 特殊显示格式 > options(digits=3) #显示小数点后三位 > x<-runif(20) ? > x [1] 0.329 ...