1.問題引入
總括:邏輯回歸其實就是將分類問題數學化,也就是將類別的現象用具體的函數去刻畫。
現象:如下圖,就是一個二分類的具體現象,我們總可以找到一條曲線(判定邊界)將兩種現象或者特征分割開來.
2.問題求解
問題1:如何用函數去刻畫上述分類問題中的判定邊界?
我們可以將上述判定邊界分成兩個類別,線性與非線性;
1).線性判定邊界方程如下:
2).非線性判定邊界:
問題2:有了邊界方程,我們如何刻畫分類現象呢?
1).二分類問題,其實可以理解為一個非此即彼的問題,對於此類問題我們就可以考慮看是否能夠轉化成一個概率問題,此處我們引入sigmoid函數;
函數表達式為:
圖像:當z<0時,函數值小於0.5,當z>0時函數值大於0.5
我們以問題引入中的圖為例,我們在兩類特征中各取一個點代入判定邊界方程,必然會得到符號相反的兩個數,再結合sigmoid函數我們便可以將二分類刻畫為g(z)>0.5的為一類,g(z)<0.5的為一類
方程為:,其中
表示樣本點x關於θ的函數
2).構建概率模型刻畫分類問題
我們可以將y=1定義為一個類別,將y=0定義成為另外一個類別
下式(1),我們就將y=1這個類別的概率p定義為,我們知道對於非此即彼的問題概率之和永遠為1,那y=0這個類別的概率,自然為
將上式整合便可表示為:
到此我們已經完成類將一個二分類的現象轉化為數學中實際的數學模型的任務了,但是我們的目標是得到最為合適的權重參數θ
問題3:該如何求解θ呢:
參數問題結合概率,立即將思維轉化到極大似然估計的頻道上
似然函數:
對數似然:
對於似然函數,我們要求的是最大值,令,求解
的最小值即可
參數更新:
j:表示的是一個樣本中的第j個特征,例如:,j就表示θ的下標
i:表示第i個樣本