計量經濟學/吳恩達課程筆記_2-1~2-7_一元線性回歸/最小二乘法_公式推導


看視頻之前,先回憶對回歸的理解:

一元線性回歸其實就是對一個自變量,一個因變量,

我們期望有 y= a+bx ,作為它們的關系式,能夠解釋x和y之間的關系,

已知一組(x,y)1-n,現在根據這個已知的條件,

  1. 關系式系數——是否一定存在?
  2. 若存在,a,b,最有可能是什么?

在吳恩達的課程里,詳細討論了第二個問題,最有可能,

最正確的a,b取值,就是 |a*xi+b-yi-y| =>(a*xi+b-yi-y)^(2)(實際值)最小的,即偏離程度最小,所以又叫,離差,或者,殘差(殘余量)

由於有多個樣本,所以我們求的是 sigma (a*xi+b-yi)的,這就是計量經濟學里說的殘差平方和的方程,或者說函數,又叫代價函數,  名字太多了...

給出, f(a,b)=(1/2n)*sigma (a*xi+b-yi),

 為什么*1/2*n?  (這里現在還有點模糊,不是很確定)

我猜是為了使殘差標准化?  n代表n項,1/2代表, 兩種不同的偏離方向, 更大,或者更小,殘差為正或負?

或者,也有可能是一個中心值?   相當於一個期望值?

求f(a,b)最小值, 實際上就是求函數極小值的最小值,

吳佬在這里講的非常詳細,他說確定這個最小值的過程,求極值的過程,就是一個使沿着梯度探索的過程,我希望不斷下山走到最底

隨便找一個點, 梯度一開始先很高, 移步一次下降得很快,但是越靠近極值處,梯度越小, 移步一次下降的越慢, 最后到極值時,梯度=0;

這個不斷移步過程, 梯度不斷變小, 或者說下降的過程 ,概括一下, 就叫"移步梯度下降法", 

更簡潔一點--又叫作 -- 梯度下降法.

那寫成代碼就是,

 

 往  a,b  兩個方向都能移步,每次移步了之后從f1位置變到f2,就要更新出發點為f2,下次從f2出發, 不斷重復,就是不斷迭代

而梯度越來越小, 實際上也就是導數越來越小趨近於0,負數不行,

所以除了導函數為0,  又可以進一步用導函數的導數----二階導來判定, 

 

所以f(a,b)=(1/2n)*sigma (a*xi+b-yi),當f(a,b)=min(f(a,b)),此時的a,b為我們所需要的最有可能滿足關系式ax+b的參數值

 

按照吳老一開始說的,這就是一個"最小化"過程.

求導,令導數為0,得到表達式;

 

 

其中一種表達式的證明:

求偏導數                                 二階導判定極值存在性---其實這也是5個基本假定其中的樣本變異性

      

 

化簡公式:

 另一種表達式的推導, 更詳細的:

https://blog.csdn.net/weixin_38278993/article/details/100556051

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM