概率統計&計量經濟學_一元線性回歸_隨機誤差項與殘差的關系_為什么自由度是n-2_徹底理解自由度定義怎么來的?


y=ax+b+e

在這一基礎上:

又可以寫成, y=ax+b+e, |e|^2=((ax+b)-y)^2

隨機干擾項 sigma e^2 和殘差平方和有類似的性質?

 

 

 

為什么這里需要這樣修正呢?自由度為什么是 n-2 ?

估計量的評估----無偏性需要滿足: 

  • 無偏性不是要求估計量與總體參數不得有偏差,因為這是不可能的,既然是抽樣,必然存在抽樣誤差,不可能與總體完全相同。
  • 無偏性指的是如果對這同一個總體反復多次抽樣,則要求各個樣本所得度出的估計量的平均值等於總體參數。

而他說的有偏估計是什么?

有偏估計(biased estimate)是指由樣本值求得的估計值與待估參數的真值之間有系統誤差,其期望值不是待估參數的真值。

 

自由度:

  • 統計知學上的自由度是指當以樣本的統計量來估計總體的參數時, 樣本中獨立或能自由變化的資料的個數,稱為該統計量的自由度.
  • 自由度計算公式:自由度=樣本個數-樣本數據受約束條件的個數,即df = n - k(df自由度,n樣本個數,k約束條件個數) 

實際的例子有:

例1

有一個有4個數據( )的樣本,其平均值 等於5,即受到 的條件限制,
在自由確定4、2、5三個數據后, 第四個數據只能是9,否則  
因而這里的自由度   .
推而廣之,任何統計量的自由度
(k為限制條件的個數)

例2

如果用刀剖柚子,在北極點沿經線方向割3刀,得6個角。這6個角可視為3對。6個角的平均角度一定是60度。
其中半邊3個角中,只會有2個可以自由選擇,一旦2個數值確定第3個角也會唯一地確定。
在總和已知的情況下,切分角的個數比能夠自由切分的個數大1。
 
在這里對於隨機誤差項e也是這樣:
我們限制條件是ab參數已知,而 ab已知的前提就是至少有兩個樣本點, 這樣才能擬合出來一對ab
所以,其中有兩個樣本點已經被確定了, 相當於有兩個樣本中的e的值是確定的, 要排除掉 -2
所以 自由度= n-2
 
至於自由度的公式=n-k , 是怎么來的呢?
 
可以用線性代數的高斯消元法來解釋,
k是確定的參數個數, 其實就是方程組未知數的個數, 我們要求k個未知數確定
就是k個未知數有且只有唯一解,
那么消元到最后方程組個數/矩陣非0行數----m-----必須滿足 m=k,這是個充要條件
 
所以至少有m=k個已知樣本,或者說確定的樣本必須有k個,
所以自由度n-k. k是限制條件的個數.
 
那從這個角度, 反過來再想想什么是自由呢?
 
我們看n個樣本,還有,n-k個樣本是未知的,
相當於還有n-k個未知數解是無窮的,這就叫自由

 

https://zhidao.baidu.com/question/161295692.html

https://zhidao.baidu.com/question/203370183.html?qbl=relate_question_3&word=%D7%D4%D3%C9%B6%C8%CA%C7n-2%3F

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM