本文将就caret包中的数据分割部分进行介绍学习。主要包括以下函数:createDataPartition(),maxDissim(),createTimeSlices(),createFolds(),createResample(),groupKFold()等 基于输出结果的简单分割 ...
本文介绍caret包中的建立模型及验证的过程。主要涉及的函数有train ,predict ,confusionMatrix ,以及pROC包中的画roc图的相关函数。 建立模型 在进行建模时,需对模型的参数进行优化,在caret包中其主要函数命令是train。 x 行为样本,列为特征的矩阵或数据框。列必须有名字 y 每个样本的结果,数值或因子型 method 指定具体的模型形式,支持大量训练模型 ...
2018-01-17 15:25 3 12350 推荐指数:
本文将就caret包中的数据分割部分进行介绍学习。主要包括以下函数:createDataPartition(),maxDissim(),createTimeSlices(),createFolds(),createResample(),groupKFold()等 基于输出结果的简单分割 ...
在进行数据挖掘时,我们并不需要将所有的自变量用来建模,而是从中选择若干最重要的变量,这称为特征选择(feature selection)。本文主要介绍基于caret包的rfe()函数的特征选择。 一种算法就是后向选择,即先将所有的变量都包括在模型中,然后计算其效能(如误差、预测精度)和变量重要 ...
在大数据如火如荼的时候,机器学习无疑成为了炙手可热的工具,机器学习是计算机科学和统计学的交叉学科, 旨在通过收集和分析数据的基础上,建立一系列的算法,模型对实际问题进行预测或分类。 R语言无疑为我们提供了很好的工具,它正是计算机科学和统计科学结合的产物,开源免费 ...
caret包(Classification and Regression Training)是一系列函数的集合,它试图对创建预测模型的过程进行流程化。本系列将就数据预处理、特征选择、抽样、模型调参等进行介绍学习。 本文将就caret包中的数据预处理部分进行介绍学习。主要包括以下函数 ...
R语言caret包中createFolds函数实现将向量随机分组。 1、 2、 ...
dummyVars函数:dummyVars creates a full set of dummy variables (i.e. less than full rank parameterization----建立一套完整的虚拟变量先举一个简单的例子: # 我们可以直接增加一列 ...
在数据分析中经常会对不同的模型做判断 一、混淆矩阵法 作用:一种比较简单的模型验证方法,可算出不同模型的预测精度 将模型的预测值与实际值组合成一个矩阵,正例一般是我们要预测的目标。真正例就是预测为正例且实际也是正例(预测正确);假反例是实际是正例但模型错误预测成反例(即预测错误);假正例 ...
shiny是一个R语言中的网络应用程序框架,可以将你的数据分析变成交互式的网络应用(web apps),简单又实用。 基本用法 一个shiny应用可以分为两部分:前端和后端,其实所有的shiny应用都是基于以下的模版: 其中,fluidPage中主要有两部分:输入函数,和输出 ...