随机森林


【随机森林】是由多个【决策树】构成的,不同决策树之间没有关联。

image

特点

  1. 可以使用特征多数据,且无需降维使用,无需特征选择。
  2. 能够进行特征重要度判断。
  3. 能够判断特征间的相关影响
  4. 不容器过拟合。
  5. 训练速度快、并行。
  6. 实现简单。
  7. 不平衡数据集、可平衡误差。
  8. 特征遗失的数据,仍可以维持准确度。

支持平台

  • scikit-learn
  • Spark MLlib
  • DolphinDB
  • XGBoost

准确度
image

使用步骤

  1. 随机抽样,训练【决策树】
  2. 随机选属性,做节点分裂属性
  3. 重复步骤2,直到不能再分裂。
  4. 建立大量决策树、形成森林。

应用方向

  • 分类 (对离散值的分类)
  • 回归 (对连续值的回归)
  • 聚类 (无监督学习聚类)
  • 异常检测

参考


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM