LR多分類推廣 - Softmax回歸*

本文轉載自查看原文 2017-11-05 17:33 5497 機器學習篇

　　LR是一個傳統的二分類模型，它也可以用於多分類任務，其基本思想是：將多分類任務拆分成若干個二分類任務，然后對每個二分類任務訓練一個模型，最后將多個模型的結果進行集成以獲得最終的分類結果。一般來說，可以采取的拆分策略有：

one vs one策略

　　假設我們有N個類別，該策略基本思想就是不同類別兩兩之間訓練一個分類器，這時我們一共會訓練出種不同的分類器。在預測時，我們將樣本提交給所有的分類器，一共會獲得N(N-1)個結果，最終結果通過投票產生。

one vs all策略

　　該策略基本思想就是將第i種類型的所有樣本作為正例，將剩下的所有樣本作為負例，進行訓練得到一個分類器。這樣我們就一共可以得到N個分類器。在預測時，我們將樣本提交給所有的分類器，一共會獲得N個結果，我們選擇其中概率值最大的那個作為最終分類結果。

softmax回歸

　　softmax是LR在多分類的推廣。與LR一樣，同屬於廣義線性模型。什么是Softmax函數？假設我們有一個數組A，表示的是數組A中的第i個元素，那么這個元素的Softmax值就是

也就是說，是該元素的指數，與所有元素指數和的比值。那么 softmax回歸模型的假設函數又是怎么樣的呢？

由上式很明顯可以得出，假設函數的分母其實就是對概率分布進行了歸一化，使得所有類別的概率之和為1；也可以看出LR其實就是K=2時的Softmax。在參數獲得上，我們可以采用one vs all策略獲得K個不同的訓練數據集進行訓練，進而針對每一類別都會得到一組參數向量。當測試樣本特征向量輸入時，我們先用假設函數針對每一個類別估算出概率值。因此我們的假設函數將要輸出一個K維的向量（向量元素和為1）來表示K個類別的估計概率，我們選擇其中得分最大的類別作為該輸入的預測類別。Softmax看起來和one vs all 的LR很像，它們最大的不同在與Softmax得到的K個類別的得分和為1，而one vs all的LR並不是。