原文:R语言caret包的学习(二)--特征选择

在进行数据挖掘时,我们并不需要将所有的自变量用来建模,而是从中选择若干最重要的变量,这称为特征选择 feature selection 。本文主要介绍基于caret包的rfe 函数的特征选择。 一种算法就是后向选择,即先将所有的变量都包括在模型中,然后计算其效能 如误差 预测精度 和变量重要排序,然后保留最重要的若干变量,再次计算效能,这样反复迭代,找出合适的自变量数目。这种算法的一个缺点在于可能 ...

2018-01-16 13:14 0 5501 推荐指数:

查看详情

R语言caret学习(三)--数据分割

本文将就caret中的数据分割部分进行介绍学习。主要包括以下函数:createDataPartition(),maxDissim(),createTimeSlices(),createFolds(),createResample(),groupKFold()等 基于输出结果的简单分割 ...

Tue Jan 16 21:16:00 CST 2018 1 4108
R语言机器学习caret运用

在大数据如火如荼的时候,机器学习无疑成为了炙手可热的工具,机器学习是计算机科学和统计学的交叉学科, 旨在通过收集和分析数据的基础上,建立一系列的算法,模型对实际问题进行预测或分类。 R语言无疑为我们提供了很好的工具,它正是计算机科学和统计科学结合的产物,开源免费 ...

Tue Mar 08 18:13:00 CST 2016 1 12133
R语言caret学习(一)--数据预处理

caret(Classification and Regression Training)是一系列函数的集合,它试图对创建预测模型的过程进行流程化。本系列将就数据预处理、特征选择、抽样、模型调参等进行介绍学习。 本文将就caret中的数据预处理部分进行介绍学习。主要包括以下函数 ...

Tue Jan 16 02:45:00 CST 2018 0 4088
R语言caret学习(四)--建立模型及验证

本文介绍caret中的建立模型及验证的过程。主要涉及的函数有train(),predict(),confusionMatrix(),以及pROC中的画roc图的相关函数。 建立模型 在进行建模时,需对模型的参数进行优化,在caret中其主要函数命令是train ...

Wed Jan 17 23:25:00 CST 2018 3 12350
机器学习特征选择

特征选择方法初识: 1、为什么要做特征选择在有限的样本数目下,用大量的特征来设计分类器计算开销太大而且分类性能差。2、特征选择的确切含义将高维空间的样本通过映射或者是变换的方式转换到低维空间,达到降维的目的,然后通过特征选取删选掉冗余和不相关的特征来进一步降维。3、特征选取的原则获取尽可能小 ...

Fri Feb 24 03:36:00 CST 2017 0 40469
机器学习特征选择方法

特征选择是一个重要的数据预处理过程,在现实机器学习任务中,获得数据之后通常先进行特征选择,此后在训练学习器,如下图所示: 进行特征选择有两个很重要的原因: 避免维数灾难:能剔除不相关(irrelevant)或冗余(redundant )的特征,从而达到减少特征个数,提高模型精确度,减少 ...

Tue May 29 08:07:00 CST 2018 2 14184
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM