回歸問題及正則化

本文轉載自查看原文 2020-06-02 19:51 737 神經網絡原理課程

1.線性回歸模型及求解方法

什么是回歸？

X的行表示每個樣本，列表示每個特征。

研究X和Y之間關系的統計分析方法稱之為回歸。其中X是自變量，Y是因變量。

利用訓練數據，使用回歸模型（如線性模型）去擬合變量之間的關系。因此訓練任務就是利用數據，來學習模型中的參數 parameter（如線性模型中的斜率和截距）。

回歸和分類的區別和聯系

區別：

分類：使用訓練集推斷輸入x所對應的離散類別(如:+1,-1)。

回歸：使用訓練集推斷輸入x所對應的輸出值，為連續實數。

聯系：

利用回歸模型進行分類：可將回歸模型的輸出離散化以進行分類，即y= sign(f(x))。

利用分類模型進行回歸：也可利用分類模型的特點,輸出其連續化的數值。

線性模型

非線性模型

線性回歸

線性回歸模型中，假設自變量和因變量滿足如下形式:

問題：已知一些數據，如何求里面的未知參數，給出一個最優解。因此通常將參數求解問題轉化為求最小誤差問題。

一般采用模型預測結果與真實結果的差的平方和作為損失函數：

概率解釋（為什么采用差的平方和作為誤差函數）：

求解參數（就是求解使得上式最小的參數θ）

矩陣解法：scikit-learn中的 Linear Regression類使用的是矩陣解法（有時也稱為最小二乘法）。可以解出線性回歸系數θ

梯度下降法：梯度下降( Gradient descent)是利用一階的梯度信息找到函數局部最優解的一種方法。

其基本思想是，要找代價函數最小值，只需要每一步都往下走，也就是每一步都可以讓誤差損失函數小一點。

對於線性回歸，參數的更新方法一般為（其中L為超參數，學習速率，即每一步走多遠）

如何求梯度？

（倒數第二步，只有k=j時才存在偏導）

先初始化一組θ，在這個θ值之上，用梯度下降法去求出下一組θ的值。當迭代到一定程度，J(θ)的值趨於穩定，此時的θ即為要求得的值。

2.多元回歸與多項式回歸

sklearn的一元線性回歸

在sklearn中，所有的估計器都帶有fit0和 predict0方法。

fit()用來擬合模型（將輸入數據輸入給模型，訓練得到參數）， predict()利用擬合出來的模型對樣本進行預測。

實例：用sklearn來構建一元線性回歸預測披薩價格

1 from sklearn.linear_model import LinearRegression
2 X=[[6],[8],[10],[14],[18]]
3 y=[[7],[9],[13],[17.5],[18]]
4 model=LinearRegression()
5 model.fit(X, y)
6 print('預測12英寸披薩價格:$%.2f'%model.predict([12])[0])

輸出結果：預測12英寸披薩價格:$13.68

線性回歸的參數

對於剛才的例子，Linear Regression類的fit()方法學習線性回歸模型y=w0+w1x

線性回歸模型學習到的參數是截距和權重系數。下圖中的直線就是匹薩直與價格的線性關系。

殘差（residual）

估計值（擬合值）與實際觀察值之間的差

多元線性回歸

from sklearn.linear_model import LinearRegression
X=[[6,2],[8,1],[10,0],[14,2],[18,0]]
y=[[7],[9],[13],[17.5],[18]]
model=LinearRegression()
model.fit(X, y)

X_test=[[8,2],[9,0],[11,2],[16,2],[12,0]]
y_test=[[11],[8.5],[15],[18],[11]]
predictions=model.predict(X_test)
for i, prediction in enumerate(predictions):
    print('Predicted:%s, Target: %s'%(prediction,y_test[i]))
print('R-squared: %.2f'%model.score(X_test,y_test))