1. 目的:根据人口普查数据来预测收入(预测每个个体年收入是否超过$50,000) 2. 数据来源:1994年美国人口普查数据,数据中共含31978个观测值,每个观测值代表一个个体 3. 变量介绍: (1)age: 年龄(以年表示) (2)workclass: 工作类别 ...
. 目的:根据房子信息,判断博士顿地区的房价。 . 数据来源:论文 Hedonic housing prices and the demand for clean air ,数据中共含 个观测值,及 个变量。其中,每个观测值代表一个人口普查区。 boston lt read.csv boston.csv 读取文件 str boston 查看数据结构 . 变量介绍: town:每一个人口普查区所在 ...
2019-11-19 12:01 1 523 推荐指数:
1. 目的:根据人口普查数据来预测收入(预测每个个体年收入是否超过$50,000) 2. 数据来源:1994年美国人口普查数据,数据中共含31978个观测值,每个观测值代表一个个体 3. 变量介绍: (1)age: 年龄(以年表示) (2)workclass: 工作类别 ...
1. 目的:根据银行客户信息,判断其是否接受银行向他们提供的个人贷款。 2. 数据来源:https://www.kaggle.com/lowecoryr/universalbank 3. 数据介绍:数据中共包含5000个观测值,14个变量。其中,每一个观测值代表一个客户 ...
OSL回归 简单的线性回归 > fit<-lm(weight~height,women) > summary(fit) Call: lm(formula = weight ~ height, data = women) Residuals: Min 1Q ...
1. 目的:构建线性回归模型并检验其假设是否成立。 2. 数据来源及背景 2.1 数据来源:数据为本人上课的案例数据, 2.2 数据背景:“玻璃制造公司”主要向新建筑承包商和汽车公司供应产品。该公司认为,他们的年销售额应与新建筑数量以及汽车生产高度相关,因此希望构建线性回归模型 ...
1. 目的:构建线性回归模型并考虑自变量之间的交互效应。 2. 数据来源及背景 2.1 数据来源:数据为本人上课的案例数据, 2.2 数据背景:一公司想通过商品销售价格及是否提供打折来预测顾客购买商品的可能性。 library(car) library(ggplot2 ...
CART:Classification and regression tree,分类与回归树。(是二叉树) CART是决策树的一种,主要由特征选择,树的生成和剪枝三部分组成。它主要用来处理分类和回归问题,下面对分别对其进行介绍。 1、回归树:使用平方误差最小准则 训练集为:D={(x1,y1 ...
本文结构: CART算法有两步 回归树的生成 分类树的生成 剪枝 CART - Classification and Regression Trees 分类与回归树,是二叉树,可以用于分类,也可以用于回归问题,最先 ...
基本概念 利用线性的方法,模拟因变量与一个或多个自变量之间的关系。自变量是模型输入值,因变量是模型基于自变量的输出值。 因变量是自变量线性叠加和的结果。 线性回归模型背后的逻辑——最小二乘法计算线性系数 最小二乘法怎么理解? 它的主要思想就是求解未知参数,使得理论值与观测值之差 ...