隨機森林


【隨機森林】是由多個【決策樹】構成的,不同決策樹之間沒有關聯。

image

特點

  1. 可以使用特征多數據,且無需降維使用,無需特征選擇。
  2. 能夠進行特征重要度判斷。
  3. 能夠判斷特征間的相關影響
  4. 不容器過擬合。
  5. 訓練速度快、並行。
  6. 實現簡單。
  7. 不平衡數據集、可平衡誤差。
  8. 特征遺失的數據,仍可以維持准確度。

支持平台

  • scikit-learn
  • Spark MLlib
  • DolphinDB
  • XGBoost

准確度
image

使用步驟

  1. 隨機抽樣,訓練【決策樹】
  2. 隨機選屬性,做節點分裂屬性
  3. 重復步驟2,直到不能再分裂。
  4. 建立大量決策樹、形成森林。

應用方向

  • 分類 (對離散值的分類)
  • 回歸 (對連續值的回歸)
  • 聚類 (無監督學習聚類)
  • 異常檢測

參考


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM