Boosting算法之Adaboost和GBDT

本文轉載自查看原文 2019-07-19 16:43 503

　　Boosting是串行式集成學習方法的代表，它使用加法模型和前向分步算法，將弱學習器提升為強學習器。Boosting系列算法里最著名的算法主要有AdaBoost和梯度提升系列算法(Gradient Boost，GB)，梯度提升系列算法里面應用最廣泛的是梯度提升樹(Gradient Boosting Decision Tree，GBDT)。

一、Adaboost

1、Adaboost介紹

　　Adaboost算法通過在訓練集上不斷調整樣本權重分布，基於不同的樣本權重分布，重復訓練多個弱分類器，最后通過結合策略將所有的弱分類器組合起來，構成強分類器。Adaboost算法在訓練過程中，注重減少每個弱學習器的誤差，在訓練下一個弱學習器時，根據上一次的訓練結果，調整樣本的權重分布，更加關注那些被分錯的樣本，使它們在下一次訓練中得到更多的關注，有更大的可能被分類正確。

Adaboost算法框架圖

2、Adaboost算法過程

1)初始化樣本權重，一共有n個樣本，則每個樣本的權重為1/n

2)在樣本分布D_t上，訓練弱分類器，for t=1,2，……T：

a、訓練分類器h_t

b、計算當前弱分類器的分類誤差率

c、判斷誤差率是否小於0.5，是則繼續，否則退出循環

d、計算當前弱分類器的權重系數alpha值

e、根據alpha值調整樣本分布D_t+1

如果樣本被正確分類，則該樣本的權重更改為：

如果樣本被錯誤分類，則該樣本的權重更改為：

3)組合弱分類器得到強分類器

3、算法偽代碼：

　　AdaBoost算法每一輪都要判斷當前基學習器是否滿足條件，一旦條件不滿足，則當前學習器被拋棄，且學習過程停止。Adaboost算法使用指數損失函數，通過最小化指數損失函數，得到在每次迭代中更新的權重參數計算公式。AdaBoost算法使用串行生成的序列化方法，多個基學習器之間存在強依賴關系。Adaboost的每一個弱分類器的目標，都是為了最小化損失函數，下一個弱分類器是在上一個分類器的基礎上對錯分樣本進行修正，所以， AdaBoost算法是注重減小偏差的算法。

　　Adaboost提供的是一種框架，可使用任何分類器作為基學習器，適用很多分類場景，通常可以獲得不錯的分類效果，例如，基於Adaboost的人臉檢測算法。

二、GBDT

1、GBDT介紹

　　GBDT在競賽和工業中都經常使用，能有效的應用於分類，回歸，排序問題，通常能有不錯的效果，是一種應用非常廣泛的算法。GBDT是梯度提升算法，也是采用加法模型。GBDT以CART回歸樹作為基學習器，通過迭代，每次通過擬合負梯度來構建新的CART回歸樹，通過構建多顆CART樹來降低模型的偏差，實現更好的分類性能。GBDT的核心思想是在每次創建新的CART回歸樹時，通過擬合當前模型損失函數的負梯度，來最小化損失函數。GBDT用於分類和回歸時都使用CART回歸樹，分類時使用指數損失或對數損失，回歸時使用平方誤差損失函數，絕對值損失函數，Huber損失函數等。當GBDT使用平方誤差作為損失函數時，負梯度正好是殘差。

　　GBDT用CART回歸樹為基分類器，在每次構建新樹時，將樣本在當前模型的殘差作為樣本標簽來訓練下一顆樹，經過多次迭代提升模型的分類性能。決策樹和GBDT雖然結果相同，但是決策樹容易過擬合，泛化能力差，可能在當前訓練集上表現較好，在其他數據集上效果較差，而GBDT是結合了多顆樹模型，具有較好的泛化能力。

2、GBDT回歸算法

　　GBDT算法過程就是創建多顆CART回歸樹的過程，只是在創建下一顆樹的時候擬合當前模型的負梯度，就是將樣本在當前模型的負梯度作為標簽，去構建下一顆樹。GBDT用於分類時也使用CART回歸樹，輸出類別值，不能直接擬合負梯度，這里只介紹GBDT回歸算法。

輸入：訓練集D={(x₁,y₁),(x₂,y₂),……,(x_m,y_m)}，最大迭代次數T，損失函數L

輸出：強學習器f(X)

1) 初始化弱學習器