随机森林计算特征对目标的重要程度——置换检验


我们都知道,在调用sklearn中的随机森林时,是可以通过feature_importances_查看每个特征的重要程度的。

其主要通过置换检验来求得特征的重要程度。

如果特征k是重要的,那么用随机的值将该列特征破坏,重新训练和评估,计算模型的泛化能里的退化程度,即:

  inportance(k) = Performance(G) - performance(G')

退化的程度可以度量特征k的重要性。


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM