機器學習——隨機森林，RandomForestClassifier參數含義詳解

本文轉載自查看原文 2019-04-04 21:44 10468 RandomForestClassifier參數

1.隨機森林模型

1 clf = RandomForestClassifier(n_estimators=200, criterion='entropy', max_depth=4)
2 rf_clf = clf.fit(x, y.ravel())

　　RandomForestClassifier函數的參數含義詳解：

　　　　Auto/None ：簡單地選取所有特征，每顆樹都可以利用他們。這種情況下，每顆樹都沒有任何的限制。

　　　　sqrt ：此選項是每顆子樹可以利用總特征數的平方根個。例如，如果變量（特征）的總數是100，所以每顆子樹只能取其中的10個。“log2”是另一種相似類型的選項。

　　　　0.2：此選項允許每個隨機森林的子樹可以利用變量（特征）數的20％。如果想考察的特征x％的作用，我們可以使用“0.X”的格式。

n_estimators：在利用最大投票數或平均值來預測之前，你想要建立子樹的數量。較多的子樹可以讓模型有更好的性能，但同時讓你的代碼變慢。你應該選擇盡可能高的值，只要你的處理器能夠承受的住，因為這使你的預測更好更穩定。

　　其他參數還包括決策樹模型的系列參數。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 吳裕雄 python 機器學習——集成學習隨機森林RandomForestClassifier分類模型機器學習sklearn（三十九）：算法實例（八）分類（四）隨機森林分類器 RandomForestClassifier 機器學習sklearn（四十二）：算法實例（十一）分類（五）RandomForestClassifier（二）實例：隨機森林在乳腺癌數據上的調參機器學習--隨機森林機器學習之隨機森林與極限森林圖解機器學習 | 隨機森林分類模型詳解機器學習---算法---隨機森林算法機器學習：用隨機森林來選擇特征機器學習總結（二）bagging與隨機森林 python機器學習——隨機森林算法