【文章推荐】R语言caret包的学习（三）--数据分割

原文：R语言caret包的学习（三）--数据分割

本文将就caret包中的数据分割部分进行介绍学习。主要包括以下函数：createDataPartition ，maxDissim ，createTimeSlices ，createFolds ，createResample ，groupKFold 等基于输出结果的简单分割 createDataPartition函数用于创建平衡数据的分割。如果函数中的参数y是一个因子向量，则对每一类随机抽样，并且 ...

2018-01-16 13:16 1 4108 推荐指数：

查看详情

R语言caret包的学习（一）--数据预处理

caret包（Classification and Regression Training）是一系列函数的集合，它试图对创建预测模型的过程进行流程化。本系列将就数据预处理、特征选择、抽样、模型调参等进行介绍学习。本文将就caret包中的数据预处理部分进行介绍学习。主要包括以下函数 ...

R语言caret包的学习（二）--特征选择

在进行数据挖掘时，我们并不需要将所有的自变量用来建模，而是从中选择若干最重要的变量，这称为特征选择（feature selection）。本文主要介绍基于caret包的rfe()函数的特征选择。一种算法就是后向选择，即先将所有的变量都包括在模型中，然后计算其效能（如误差、预测精度）和变量重要 ...

R语言机器学习之caret包运用

在大数据如火如荼的时候，机器学习无疑成为了炙手可热的工具，机器学习是计算机科学和统计学的交叉学科，旨在通过收集和分析数据的基础上，建立一系列的算法，模型对实际问题进行预测或分类。 R语言无疑为我们提供了很好的工具，它正是计算机科学和统计科学结合的产物，开源免费 ...

R语言caret包的学习（四）--建立模型及验证

本文介绍caret包中的建立模型及验证的过程。主要涉及的函数有train()，predict()，confusionMatrix()，以及pROC包中的画roc图的相关函数。建立模型在进行建模时，需对模型的参数进行优化，在caret包中其主要函数命令是train ...

R语言caret包中createFolds函数

R语言caret包中createFolds函数实现将向量随机分组。 1、 2、 ...

R语言：利用caret包中的dummyVars函数进行虚拟变量处理

dummyVars函数:dummyVars creates a full set of dummy variables (i.e. less than full rank parameterizati ...

R语言数据集分割

好在R和Python中有现成的数据集分割函数，避免手动写函数导致划分比例不合理、训练集与测试集的样本的结构与总体不均衡的问题。 R语言中caTools包中的sample.split函数可以用来自动将原始数据集分割成训练集和测试集。方法一 caTools中的sample.split函数 ...

R语言shiny包的学习

shiny是一个R语言中的网络应用程序框架，可以将你的数据分析变成交互式的网络应用(web apps)，简单又实用。基本用法一个shiny应用可以分为两部分：前端和后端，其实所有的shiny应用都是基于以下的模版：其中，fluidPage中主要有两部分：输入函数，和输出 ...

原文：R语言caret包的学习（三）--数据分割

相关推荐

相关标签