機器學習:什么是欠擬合和過擬合


https://blog.csdn.net/u011630575/article/details/71158656

1. 什么是欠擬合和過擬合

先看三張圖片,這三張圖片是線性回歸模型 擬合的函數和訓練集的關系

  1. 第一張圖片擬合的函數和訓練集誤差較大,我們稱這種情況為 欠擬合
  2. 第二張圖片擬合的函數和訓練集誤差較小,我們稱這種情況為 合適擬合
  3. 第三張圖片擬合的函數完美的匹配訓練集數據,我們稱這種情況為 過擬合

  

類似的,對於邏輯回歸同樣也存在欠擬合和過擬合問題,如下三張圖

  

2. 如何解決欠擬合和過擬合問題

欠擬合問題,根本的原因是特征維度過少,導致擬合的函數無法滿足訓練集,誤差較大。

欠擬合問題可以通過增加特征維度來解決。

過擬合問題,根本的原因則是特征維度過多,導致擬合的函數完美的經過訓練集,但是對新數據的預測結果則較差。增加模型的復雜度,不要用簡單的線性回歸,適當的采用二次回歸,將訓練集合擴大,采集更多的數據。

解決過擬合問題,則有2個途徑:

  1. 減少特征維度; 可以人工選擇保留的特征,或者模型選擇算法
  2. 正則化; 保留所有的特征,通過降低參數θ的值,來影響模型
  3.  數據集擴增; 即需要得到更多的符合要求的數據,即和已有的數據是獨立同分布的

3. 正則化

回到前面過擬合例子, h(x) = θ0 + θ1x1 + θ2x2 + θ3x3 + θ4x4

 

從圖中可以看出,解決這個過擬合問題可以通過消除特征x3和x4的影響, 我們稱為對參數的懲罰, 也就是使得參數θ3, θ4接近於0。

最簡單的方法是對代價函數進行改造,例如

這樣在求解最小化代價函數的時候使得參數θ3, θ4接近於0。

正則化其實就是通過對參數θ的懲罰來影響整個模型

4. 線性回歸使用正則化

前面幾篇文章中,線性回歸的代價函數J(θ)表達式如下

正則化后,代價函數J(θ)表達式如下,注意j從1開始

注意λ值不能設置過大,否則會導致求出的參數除了θ0,其它θ1,θ2 ... θn值約等於0,導致預測函數h(x)出現極大偏差

我們的目標依然是求J(θ)最小值,我們還是用梯度下降算法正規方程求解最小化J(θ)

1. 梯度下降算法(注意需要區分θ0和其它參數的更新等式)

2. 正規方程

對於正規方程來,需要修改等式如下

系數λ 所乘的矩陣為 (n+1)*(n+1)維

5. 邏輯回歸使用正則化

和線性回歸模型類型,邏輯回歸也可以通過正則化來解決過擬合問題。

邏輯回歸的代價函數J(θ)表達式如下

正則化邏輯回歸的代價函數,是在等式后加上一項,注意j從1開始

 

同樣的用梯度下降算法求解最小化J(θ),也需要做改變

不同的是邏輯回歸模型中的預測函數 h(x)和線性回歸不同

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM