原文:拓端tecdat|R语言随机森林模型中具有相关特征的变量重要性

原文链接:http: tecdat.cn p 变量重要性图是查看模型中哪些变量有趣的好工具。由于我们通常在随机森林中使用它,因此它看起来非常适合非常大的数据集。大型数据集的问题在于许多特征是 相关的 ,在这种情况下,很难比较可变重要性图的值的解释。例如,考虑一个非常简单的线性模型 在这里,我们使用一个随机森林的特征之间的关系模型,但实际上,我们考虑另一个特点 不用于产生数据 ,即相关 。我们考虑这 ...

2020-05-20 14:49 0 1349 推荐指数:

查看详情

tecdatR语言用加多元线性回归、随机森林、弹性网络模型预测鲍鱼年龄和可视化

原文链接:http://tecdat.cn/?p=24127 原文出处:数据部落公众号 介绍 鲍鱼是一种贝类,在世界许多地方都被视为美味佳肴。铁和泛酸的极好来源,是澳大利亚、美国和东亚的营养食品资源和农业。100 克鲍鱼可提供超过 20% 的每日推荐摄入量。鲍鱼的经济价值与其年龄呈正相关 ...

Tue Nov 02 00:52:00 CST 2021 0 180
利用随机森林进行特征重要性评估

https://blog.csdn.net/xiezhen_zheng/article/details/82011908 参考:特征筛选方法 https://blog.csdn.net/m0_37316673/article/details/107524247 ...

Mon Sep 21 23:53:00 CST 2020 0 793
随机森林是否需要交叉验证+特征重要性

随机森林不需要交叉验证! 随机森林属于bagging集成算法,采用Bootstrap,理论和实践可以发现Bootstrap每次约有1/3的样本不会出现在Bootstrap所采集的样本集合。故没有参加决策树的建立,这些数据称为袋外数据oob,歪点子来了,这些袋外数据可以用于取代测试集 ...

Wed Apr 01 05:23:00 CST 2020 0 3862
tecdat|R语言广义相加(加模型(GAMs)与光滑函数可视化

原文链接:http://tecdat.cn/?p=23509 原文出处:数据部落公众号 我们在研究工作中使用广义加模型(GAMs)。mgcv软件包是一套优秀的软件,可以为非常大的数据集指定、拟合和可视化GAMs。 这篇文章介绍一下广义加模型(GAMs)目前可以实现的功能 ...

Wed Aug 25 00:51:00 CST 2021 0 112
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM