隨機森林計算特征對目標的重要程度——置換檢驗


我們都知道,在調用sklearn中的隨機森林時,是可以通過feature_importances_查看每個特征的重要程度的。

其主要通過置換檢驗來求得特征的重要程度。

如果特征k是重要的,那么用隨機的值將該列特征破壞,重新訓練和評估,計算模型的泛化能里的退化程度,即:

  inportance(k) = Performance(G) - performance(G')

退化的程度可以度量特征k的重要性。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM