一、線性回歸

　　現在這里有一個例子
　　數據：工資和年齡（2個特征）
　　目標：預測銀行會貸款給我多少錢（標簽）
　　考慮：工資和年齡都會影響最終銀行貸款的結果那么它們各自有多大的影響呢？（參數）

　　輸入為工資和年齡，輸出為銀行貸款的額度。那么輸入和輸出到底有什么關系呢？

　　假設X₁,X₂就是我們的兩個特征（年齡，工資），Y是銀行最終會借給我們多少錢

　　線性回歸呢就是找到最合適的一條線（想象一個高維）來最好的擬合我們的數據點，那么這個地方因為自變量涉及兩個，所以最終目的就是找出一個擬合平面。

　　那么現在繼續假設θ₁是年齡的參數， θ₂是工資的參數。那么擬合的平面表達式為(θ₀為偏置項，θ₁、θ₂為權重參數)：

　　這里的話總共有兩個特征，那么當有n個特征的時候的表達式為(θ₀對應的X₀全為1)：

二、誤差

　　真實值和預測值之間肯定是要存在差異的（用 ε 來表示該誤差），而對於每個樣本來說，真實值等於預測值加上誤差值，公式表達為：

　　預測值與誤差：

　　由於誤差服從高斯分布：

　　將兩個式子整合得到：

　　似然函數(什么樣的參數跟我們的數據組合后（這個組合后的值就是預測值）恰好是真實值)，最大似然估計(參數跟數據組合后恰好是真實值的概率是最大的)，下面兩個豎線數學符號的意思是進行累乘。

　　對數似然(乘法理解，加法就容易了，對數里面乘法可以轉化成加法)：

　　對上面的對數似然進行整合可以得到：

　　我們的最終目標就是讓似然函數（對數似然也是一樣）越大越好，因為上面這個式子，前半部分是恆大於0的且是常數，后半部分也是恆大於0的，所以要保持整個式子最大，就只有讓后半部分越小越好。於是可以得到：

　　那下面的過程就是怎么樣才能求解使得上面這個式子的值越小越好呢？

　　這上面的推導過程表示並沒有看得太懂哈哈哈。但是結果表示當θ取這個值的時候，整體的偏導等於0，而偏導等於0是極小值點，至於為什么是極小值點，涉及機器學習中的凸優化問題。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 【機器學習】算法原理詳細推導與實現(一):線性回歸線性回歸算法的原理機器學習——簡單線性回歸（原理推導+算法描述+代碼實現）線性回歸的推導機器學習多元線性回歸的數學原理推導機器學習——線性回歸的原理，推導過程，源碼，評價線性回歸算法原理（附java實現）多元線性回歸推導過程線性回歸方程推導邏輯回歸原理推導