隨機森林之oob的計算過程

本文轉載自查看原文 2019-07-08 11:58 1519

隨機森林有一個重要的優點就是，沒有必要對它進行交叉驗證或者用一個獨立的測試集來獲得誤差的一個無偏估計。它可以在內部進行評估，也就是說在生成的過程中就可以對誤差建立一個無偏估計。

隨機森林在生成每顆決策樹時，會隨機且有放回的抽取樣本，每棵決策樹會有大概1/3的樣本未抽取到，這些樣本就是每棵樹的oob樣本。具體計算過程如下：

根據這種特點，我們可以對其進行oob估計，步驟如下：

　　1、計算決策樹對其對應的oob樣本的分類情況（約有1/3棵樹參與oob估計）

　　2、以投票的方式確定該樣本的分類

　　3、計算oob-error：分類錯誤的樣本數占總樣本數的比值

oob誤分率是隨機森林泛化誤差的一個無偏估計，它的結果近似於需要大量計算的k折交叉驗證。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 隨機森林之oob error 估計投影矩陣的計算過程隨機森林算法過程及分析 pytorch BatchNorm參數詳解，計算過程 Jordan標准型的計算過程！！！！！！！！！！使用隨機森林計算特征重要度避免計算過程中出現溢出的一個技巧卷積神經網絡中一維卷積的計算過程 4個優化方法，讓你能了解join計算過程更透徹隨機森林