我們都知道,在調用sklearn中的隨機森林時,是可以通過feature_importances_查看每個特征的重要程度的。
其主要通過置換檢驗來求得特征的重要程度。
如果特征k是重要的,那么用隨機的值將該列特征破壞,重新訓練和評估,計算模型的泛化能里的退化程度,即:
inportance(k) = Performance(G) - performance(G')
退化的程度可以度量特征k的重要性。
我們都知道,在調用sklearn中的隨機森林時,是可以通過feature_importances_查看每個特征的重要程度的。
其主要通過置換檢驗來求得特征的重要程度。
如果特征k是重要的,那么用隨機的值將該列特征破壞,重新訓練和評估,計算模型的泛化能里的退化程度,即:
inportance(k) = Performance(G) - performance(G')
退化的程度可以度量特征k的重要性。
本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。