機器學習之線性回歸、多項式回歸

本文轉載自查看原文 2017-08-26 10:47 5625 機器學習/ 機器學習&深度學習

前言

以下內容是個人學習之后的感悟，轉載請注明出處~

簡介

回歸屬於有監督學習中的一種方法。該方法的核心思想是從連續型統計數據中得到數學模型，然后將該數學模型用於

預測或者分類。該方法處理的數據可以是多維的。

一、線性回歸

在連續型統計數據情況下，選取大量的樣本數據，如下圖中的紅色十字表示的(x，y)值，根據這些樣本的趨勢，

選擇合適的假設函數，此處選擇的是線性回歸的假設函數。根據樣本，計算代價函數的極小值，此時的θ值就是我們

需要得到的數學模型的參數值。

計算代價函數的極小值~ why? (沒學過統計概率學的童鞋可能不太清楚)

首先，我們要尋找的目標，是能夠盡量符合所有樣本的數學模型。當然，一般情況下，這是找不到的，那么，我

們就會考慮：就算不能找到完全符合的數學模型，我們也可以找盡可能符合的數學模型來代替。沒錯~，在線性規划

中，我們采用了最小二乘法，使樣本在數學模型中的誤差平方和最小，這也就產生了代價函數。我們只需要找到

代價函數的極小值，此時的θ代入到假設函數中，我們就得到了比較符合的數學模型。

有人會問：不是說代價函數J(θ₀，θ₁)是由最小二乘法中的誤差平方和推導而來嗎？前面的1/m，我們能

理解，是平均了一下，那么1/2是哪來的呢？

其實吧，剛開始我也不是特別明白，直到求解J(θ₀，θ₁)的極小值時，我才恍然大悟。原來，我們在使用

梯度下降法時，需要求導（懂了嗎？誤差的平方求導的時候會產生一個2）。當然，這只是我個人理解~

尋找J(θ₀，θ₁)的極小值點，獲得此時的θ值。

梯度下降法（具體詳情點鏈接）

兩種方法的比較如下：

二、多項式回歸

前面提到，根據樣本的趨勢來決定假設函數，當趨勢較為復雜時，線性模型就不適用了。下圖是房子的價格與尺

寸的關系圖，從圖中我們可以看出，符合樣本趨勢的數學模型應該是非線性的，在這里我們采用的是二次曲線。

但是，我們怎么去求該數學模型的代價函數極小值呢？太復雜了，oh~ no!

其實，我們可以簡化求解的復雜度，只需要把符合趨勢的假設函數轉換為等價的線性模型即可。具體轉換見下面。

通過以下轉換：

得到：

既然得到了線性數學模型，接下來就是你的showtime了~~

以上是全部內容，如果有什么地方不對，請在下面留言，謝謝~

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python 機器學習多項式回歸【機器學習】多項式回歸機器學習：多項式回歸（scikit-learn中的多項式回歸和 Pipeline） Andrew Ng機器學習算法入門((七):特征選擇和多項式回歸 scikit-learn機器學習(三)多項式回歸(二階，三階，九階) 拓端tecdat|R語言曲線回歸：多項式回歸、多項式樣條回歸、非線性回歸數據分析多項式回歸原理及在sklearn中的使用+pipeline 拓端tecdat|R語言里的非線性模型：多項式回歸、局部樣條、平滑樣條、廣義加性模型分析多項式回歸擬合新冠病毒確診人數 02-08 多項式回歸(波士頓房價預測)