機器學習入門-顯示特征重要性的排序


根據每一個特征分類后的gini系數之和除於總特征的gini系數來計算特征重要性

import pandas as pd
import matplotlib.pyplot as plt

# 顯示出隨機森林特征的重要性,並做條形圖
rfr = RandomForestRegressor(min_samples_split=6, n_estimators=100)
rfr.fit(train_x, train_y)
print(rfr.score(test_x, test_y))
# 使用pd.Series進行組合,值是特征重要性的值,index是樣本特征,.sort_value 進行排序操作
feature_important = pd.Series(rfr.feature_importances_, index = housing.feature_names).sort_values(ascending=False)
plt.bar(feature_important.index, feature_important.data)
plt.show()


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM