梯度提升樹-負梯度和殘差的理解

本文轉載自查看原文 2018-01-09 17:17 2886

提升樹：提升方法采用加法模型（基函數的線性組合）與前向分布算法，以決策樹為基函數的提升方法為提升樹。

　　　　對於一般的回歸樹，采用平方誤差損失函數，這時根據前向分布每次只需要達到最優化，就能保證整體上的優化。由於平方誤差的特殊性，可以推導出每次只需要擬合殘差（真實值-預測值）。

梯度提升樹：而對於其他損失函數，提出了利用負梯度表示殘差的近似值。

為什么采用損失函數的負梯度？

L(y,f(x))中將f(x)看成一個參數，為了使L損失函數最小，采用梯度下降的方法即：

f(x)_m=f(x)_m-1-(dL/df(x))//與一般的梯度下降法相同

而f(x)_m=f(x)_m-1+T(x;Q)//Q為前向分布法每次得到這棵樹的參數，T(x;Q)為訓練的新樹

所以有f(x)_m-1+T(x;Q)=f(x)_m-1-(dL/df(x))

所以有T(x;Q)=-(dL/df(x))

左邊為預測值，右邊為真實值，所以整個過程就變成了每次擬合損失函數的負梯度的值。

所以可以將這種方法看成一般損失函數的情況，而平方損失是特殊的情況（擬合殘差）。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 為什么常說GBDT用負梯度近似殘差? ResNet殘差網絡（可以解決梯度消失）梯度提升決策樹(GBDT）梯度提升決策樹算法過程 GBDT：梯度提升決策樹梯度提升樹(GBDT)原理小結集成學習之梯度提升樹(GBDT)算法 GBDT（梯度提升樹）原理小結梯度提升樹 Gradient Boosting Decision Tree GBDT 梯度提升樹原理總結