特征工程 —— 特征重要性排序（Random Forest）

本文轉載自查看原文 2018-04-16 23:17 2239 機器學習

樹模型天然會對特征進行重要性排序，以分裂數據集，構建分支；

1. 使用 Random Forest

from sklearn.datasets import load_boston
from sklearn.ensemble import RandomForestRegressor


boston_data = load_boston()
X = boston_data['data']
y = boston_data['target']
    # dir(boston_data) ⇒ 查看其支持的屬性為 ['DESCR', 'data', 'feature_names', 'target']
rf = RandomForestRegressor()
rf.fit(X, y)

print(sorted(zip(boston_data['feature_names'], map(lambda x: round(x, 4), 
                                                   rf.feature_importances_)),
             key=operator.itemgetter(1), reverse=True))

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 R代碼|基於特征重要性的特征排序代碼機器學習入門-顯示特征重要性的排序特征重要性之排列重要性Permutaion Importance 特征重要性--feature_importance 特征重要性篩選方法特征重要性之shap value xgboost 特征重要性計算 XGBoost 輸出特征重要性以及篩選特征 3(3).特征選擇---嵌入法（特征重要性評估） XGBoost 輸出特征重要性以及篩選特征