邏輯回歸原理小結

本文轉載自查看原文 2017-03-14 15:26 1160

　　　邏輯回歸是一個分類算法，它可以處理二元分類以及多元分類。雖然它名字里面有“回歸”兩個字，卻不是一個回歸算法。那為什么有“回歸”這個誤導性的詞呢？個人認為，雖然邏輯回歸是分類模型，但是它的原理里面卻殘留着回歸模型的影子，本文對邏輯回歸原理做一個總結。

1. 從線性回歸到邏輯回歸

　　　　我們知道，線性回歸的模型是求出輸出特征向量Y和輸入樣本矩陣X之間的線性關系系數

2. 二元邏輯回歸的模型

　　　　上一節我們提到對線性回歸的結果做一個在函數g上的轉換，可以變化為邏輯回歸。這個函數g在邏輯回歸中我們一般取為sigmoid函數，形式如下：

　　　　它有一個非常好的性質，即當z趨於正無窮時，

　　　　這個通過函數對

　　　　如果我們令

　　　　其中x為樣本輸入，

　　　　此處我們也可以將模型寫成矩陣模式：

　　　　其中

　　　　理解了二元分類回歸的模型，接着我們就要看模型的損失函數了，我們的目標是極小化損失函數來得到對應的模型系數

3. 二元邏輯回歸的損失函數

　　　　回顧下線性回歸的損失函數，由於線性回歸是連續的，所以可以使用模型誤差的的平方和來定義損失函數。但是邏輯回歸不是連續的，自然線性回歸損失函數定義的經驗就用不上了。不過我們可以用最大似然法來推導出我們的損失函數。

　　　　我們知道，按照第二節二元邏輯回歸的定義，假設我們的樣本輸出是0或者1兩類。那么我們有：

　　　　把這兩個式子寫成一個式子，就是：

　　　　其中y的取值只能是0或者1。

　　　　用矩陣法表示，即為：

　　　　得到了y的概率分布函數表達式，我們就可以用似然函數最大化來求解我們需要的模型系數

　　　　為了方便求解，這里我們用對數似然函數最大化，對數似然函數取反即為我們的損失函數

　　　　似然函數的代數表達式為：

　　　　其中m為樣本的個數。

　　　　對似然函數對數化取反的表達式，即損失函數表達式為：

　　　　損失函數用矩陣法表達更加簡潔：

　　　　其中E為單位矩陣,

4. 二元邏輯回歸的損失函數的優化方法

　　　　對於二元邏輯回歸的損失函數極小化，有比較多的方法，最常見的有梯度下降法，坐標軸下降法，等牛頓法等。這里推導出梯度下降法中

　　　　對於

　　　　這一步我們用到了矩陣求導的鏈式法則，和下面三個矩陣求導公式：

　　　　對於剛才的求導公式我們進行化簡可得：

　　　　從而在梯度下降法中每一步向量

　　　　其中，

　　　　實踐中，我們一般不用操心優化方法，大部分機器學習庫都內置了各種邏輯回歸的優化方法，不過了解至少一種優化方法還是有必要的。

5. 二元邏輯回歸的正則化

　　　　邏輯回歸也會面臨過擬合問題，所以我們也要考慮正則化。常見的有L1正則化和L2正則化。

　　　　邏輯回歸的L1正則化的損失函數表達式如下，相比普通的邏輯回歸損失函數，增加了L1的范數做作為懲罰，超參數

　　　　二元邏輯回歸的L1正則化損失函數表達式如下：

　　　　其中

　　　　邏輯回歸的L1正則化損失函數的優化方法常用的有坐標軸下降法和最小角回歸法。

　　　　二元邏輯回歸的L2正則化損失函數表達式如下：

　　　　其中

　　　　邏輯回歸的L2正則化損失函數的優化方法和普通的邏輯回歸類似。

6. 二元邏輯回歸的推廣：多元邏輯回歸

　　　　前面幾節我們的邏輯回歸的模型和損失函數都局限於二元邏輯回歸，實際上二元邏輯回歸的模型和損失函數很容易推廣到多元邏輯回歸。比如總是認為某種類型為正值，其余為0值，這種方法為最常用的one-vs-reset，簡稱OvR.

　　　　另一種多元邏輯回歸的方法是Many-vs-Many(MvM)，它會選擇一部分類別的樣本和另一部分類別的樣本來做邏輯回歸二分類。最常用的是One-Vs-One（OvO）。OvO是MvM的特例。每次我們選擇兩類樣本來做二元邏輯回歸，具體如下：

　　　　首先回顧下二元邏輯回歸。

　　　　其中y只能取到0和1。則有：

　　　　如果我們要推廣到多元邏輯回歸，則模型要稍微做下擴展。

　　　　我們假設是K元分類模型,即樣本輸出y的取值為1，2，。。。，K。

　　　　根據二元邏輯回歸的經驗，我們有：

　　　　...

　　　　上面有K-1個方程。

　　　　加上概率之和為1的方程如下：

　　　　從而得到K個方程，里面有K個邏輯回歸的概率分布。

　　　　解出這個K元一次方程組，得到K元邏輯回歸的概率分布如下：

　　　　多元邏輯回歸的損失函數推導以及優化方法和二元邏輯回歸類似，這里就不累述。

7.小結

　　　　邏輯回歸尤其是二元邏輯回歸是非常常見的模型，訓練速度很快，雖然使用起來沒有支持向量機（SVM）那么占主流，但是解決普通的分類問題是足夠了，訓練速度也比起SVM要快不少。如果你要理解機器學習分類算法，那么第一個應該學習的分類算法個人覺得應該是邏輯回歸。理解了邏輯回歸，其他的分類算法再學習起來應該沒有那么難了。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 邏輯回歸原理小結邏輯回歸原理小結線性回歸原理小結邏輯回歸原理推導邏輯回歸1-邏輯回歸原理詳解邏輯回歸：原理及python實現機器學習--邏輯回歸模型原理邏輯回歸算法的原理及實現(LR) Logistic Regression（邏輯回歸）（一）基本原理邏輯回歸原理，推導，sklearn應用