本文将就caret包中的数据分割部分进行介绍学习。主要包括以下函数:createDataPartition(),maxDissim(),createTimeSlices(),createFolds(),createResample(),groupKFold()等 基于输出结果的简单分割 ...
caret包 Classification and Regression Training 是一系列函数的集合,它试图对创建预测模型的过程进行流程化。本系列将就数据预处理 特征选择 抽样 模型调参等进行介绍学习。 本文将就caret包中的数据预处理部分进行介绍学习。主要包括以下函数:model.matrix ,dummyVars ,nearZeroVar ,findCorrelation ,fin ...
2018-01-15 18:45 0 4088 推荐指数:
本文将就caret包中的数据分割部分进行介绍学习。主要包括以下函数:createDataPartition(),maxDissim(),createTimeSlices(),createFolds(),createResample(),groupKFold()等 基于输出结果的简单分割 ...
在进行数据挖掘时,我们并不需要将所有的自变量用来建模,而是从中选择若干最重要的变量,这称为特征选择(feature selection)。本文主要介绍基于caret包的rfe()函数的特征选择。 一种算法就是后向选择,即先将所有的变量都包括在模型中,然后计算其效能(如误差、预测精度)和变量重要 ...
在大数据如火如荼的时候,机器学习无疑成为了炙手可热的工具,机器学习是计算机科学和统计学的交叉学科, 旨在通过收集和分析数据的基础上,建立一系列的算法,模型对实际问题进行预测或分类。 R语言无疑为我们提供了很好的工具,它正是计算机科学和统计科学结合的产物,开源免费 ...
本文介绍caret包中的建立模型及验证的过程。主要涉及的函数有train(),predict(),confusionMatrix(),以及pROC包中的画roc图的相关函数。 建立模型 在进行建模时,需对模型的参数进行优化,在caret包中其主要函数命令是train ...
一、日期时间、字符串的处理 日期 Date: 日期类,年与日 POSIXct: 日期时间类,精确到秒,用数字表示 POSIXlt: 日期时间类,精确到秒,用列表表示 Sys.date(), date(), difftime(), ISOdate(), ISOdatetime ...
R语言caret包中createFolds函数实现将向量随机分组。 1、 2、 ...
rank,用数字代表不同情感 显然,对于单个变量进行如上处理并不困难,但是如果面对多个因 ...
数据预处理(Python&R)学习笔记 首先,让我们先来看一下我们要处理的数据实例: 我们的目的是让这样的原始数据处理成机器学习算法可以直接计算的额数据形式。对于该数据实例,有以下几个操作关键: 1.进行缺失数据处理 对缺失值进行处理的一般思路是使用这一列数据 ...