邏輯回歸1-邏輯回歸原理詳解 - 碼上歡樂

相關內容簡體繁體

邏輯回歸1-邏輯回歸原理詳解

本文轉載自查看原文 2019-08-09 14:20 847 傳統機器學習

1.1 邏輯回歸原理詳解

1.1.1 LR原理講解+公式推導

從公式推導中詳細講解邏輯回歸算法的原理。

線性回歸模型：

邏輯回歸是用來估計一個實例屬於某個特定類別的概率，是一個二分類算法，如果預估概率大於等於50%，則模型預測該實例為正類，反之，則預測為負類。

則需要把y從負無窮大到正無窮大映射為概率p從0到1，可以設置為：

則：

兩邊取e,整理后，得到邏輯函數：

一旦邏輯回歸模型估算出實例x屬於正類的概率為p,那么就可以輕松推斷出y值。

假設：

則：

我們需要對系數θ估計，可以采用極大似然估計（MLE），通過最大化對數似然值來估計參數。

注：極大似然估計定義見下文詳細講解。

兩邊取對數，連乘會改為連加。

單個訓練實例的成本函數：

當p接近於0時，-log(p)就會變得非常大，如果模型估計一個正類的概率接近於0，成本將會變得很高。同理，估計一個負類實例的概率接近於1，成本也會變得非常高。

整個訓練集的成本函數即為訓練實例的平均成本。邏輯回歸成本函數表示如下。

邏輯回歸成本函數（log損失函數）：

這是一個凸函數，通過梯度上升能夠找出全局最大值。（只要學習率不是太高，又可以長時間等待）

對logL求某個系數θ的偏導：

手寫過程如下所示：

即：邏輯回歸成本函數的偏導數為每個實例真實值與預測值的誤差，將其乘以第j個特征值，並求和。

那么怎么獲得系數呢？通過這個函數開口向下，使用梯度上升算法，獲得全局最大值。

：學習率，自己給定，為固定值，可調整，不宜過高。

：對求偏導

θ：初始化一個任意值

θ初始化一個值后，可以計算得到預測的y值，計算預測誤差，得到偏導，通過梯度上升算法更新θ值。

我們反過來回顧下：

通過梯度上升算法獲得擬合效果最好的系數θ，根據sigmoid函數，輸入特征X代入，得到概率p值，通過P值是否大於0.5，最終得到預測結果y。

1.1.2 邏輯回歸的應用場景和優缺點

1.1.2.1 應用場景

Logistic回歸是一種用於解決二分類問題的機器學習方法，是一種判別模型：表現為直接對條件概率P(y|x)建模，而不關心背后的數據分布P(x,y)
用於估計某種事物的可能性。比如某用戶購買某商品的可能性、某病人患有某種疾病的可能性、以及某廣告被用戶點擊的可能性等。

1.1.3 優缺點

1.1.3.1 優點

系數表示該特征的權重大小，可解釋性強，原理基於線性回歸，易於理解。
計算代價不高

1.1.3.2 缺點

容易欠擬合，分類精度可能不高

1.1.4 專業名詞介紹

1.1.4.1 極大似然估計

極大似然估計，又稱最大似然估計。

極大似然估計的原理，用一張圖片來說明，如下圖所示：

試驗是取出一個球是黑球，第一印象就是這個黑球最像是從乙箱取出來的，這個推斷符合人們的經驗事實。“最像”就是“最大似然”之意，就是概率性是最大的。

總而言之，極大似然估計的目的就是：利用已知的樣本結果，反推最有可能（最大概率）導致這樣結果的參數值。

原理：極大似然估計是建立在極大似然原理的基礎上的一個統計方法，是概率論在統計學中的應用。極大似然估計提供了一種給定觀察數據來評估模型參數的方法，即：“模型已定，參數未知”。通過若干次試驗，觀察其結果，利用試驗結果得到某個參數值能夠使樣本出現的概率為最大，則稱為極大似然估計。以下僅介紹總體X為離散型的情況。

若總體X（即輸入特征）屬離散型，其分布律已知（即輸出結果y已知）， θ為待估參數，設為來自X的樣本，則的聯合分布律為

又設是相應於樣本的一個樣本值，即事件發生的概率為：

如果是參數空間中能使似然函數最大的θ值，則應該是“最可能”的參數值，那么就是θ的極大似然估計量。它是樣本集的函數，記作：

稱作極大似然函數估計值。

1.1.4.2 凸函數、凹函數

1.1.4.2.1 函數凹凸性定義

以下為國內的凹凸性定義，與國外凹凸性定義相反。

設在區間I上有定義

（1）若對任意的，有

則稱在內為凸函數，如圖1-3-3所示。

（2）若對任意的，有

則稱在內為凹函數，如圖1-3-4所示。

1.1.4.2.2 函數凹凸判別法

定理：

（1）若在內有，則在內為凸函數

（2）若在內有，則在內為凹函數

1.1.4.2.3 邏輯回歸目標函數是凸函數證明

目標函數：

一階偏導：

證明過程見LR公式推導部分。

二階偏導：

由於，即，則恆成立，所以目標函數是凸函數。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 邏輯回歸原理小結邏輯回歸原理小結邏輯回歸線性回歸與邏輯回歸【機器學習】算法原理詳細推導與實現(二):邏輯回歸機器學習算法--邏輯回歸原理介紹邏輯回歸(Logistic Regression)詳解,公式推導及代碼實現 Logistic回歸（邏輯回歸）和softmax回歸 python實現邏輯回歸邏輯回歸算法介紹

粵ICP備18138465號 © 2018-2026 CODEPRJ.COM