根據每一個特征分類后的gini系數之和除於總特征的gini系數來計算特征重要性
import pandas as pd import matplotlib.pyplot as plt # 顯示出隨機森林特征的重要性,並做條形圖 rfr = RandomForestRegressor(min_samples_split=6, n_estimators=100) rfr.fit(train_x, train_y) print(rfr.score(test_x, test_y)) # 使用pd.Series進行組合,值是特征重要性的值,index是樣本特征,.sort_value 進行排序操作 feature_important = pd.Series(rfr.feature_importances_, index = housing.feature_names).sort_values(ascending=False) plt.bar(feature_important.index, feature_important.data) plt.show()