y=ax+b+e
在這一基礎上:
又可以寫成, y=ax+b+e, |e|^2=((ax+b)-y)^2
隨機干擾項 sigma e^2 和殘差平方和有類似的性質?
為什么這里需要這樣修正呢?自由度為什么是 n-2 ?
估計量的評估----無偏性需要滿足:
- 無偏性不是要求估計量與總體參數不得有偏差,因為這是不可能的,既然是抽樣,必然存在抽樣誤差,不可能與總體完全相同。
- 無偏性指的是如果對這同一個總體反復多次抽樣,則要求各個樣本所得度出的估計量的平均值等於總體參數。
而他說的有偏估計是什么?
有偏估計(biased estimate)是指由樣本值求得的估計值與待估參數的真值之間有系統誤差,其期望值不是待估參數的真值。
自由度:
- 統計知學上的自由度是指當以樣本的統計量來估計總體的參數時, 樣本中獨立或能自由變化的資料的個數,稱為該統計量的自由度.
- 自由度計算公式:自由度=樣本個數-樣本數據受約束條件的個數,即df = n - k(df自由度,n樣本個數,k約束條件個數)
實際的例子有:
例1
有一個有4個數據(
)的樣本,其平均值
等於5,即受到
的條件限制,



在自由確定4、2、5三個數據后, 第四個數據只能是9,否則
。

因而這里的自由度
.

推而廣之,任何統計量的自由度
(k為限制條件的個數)

例2
如果用刀剖柚子,在北極點沿經線方向割3刀,得6個角。這6個角可視為3對。6個角的平均角度一定是60度。
其中半邊3個角中,只會有2個可以自由選擇,一旦2個數值確定第3個角也會唯一地確定。
在總和已知的情況下,切分角的個數比能夠自由切分的個數大1。
在這里對於隨機誤差項e也是這樣:
我們限制條件是ab參數已知,而 ab已知的前提就是至少有兩個樣本點, 這樣才能擬合出來一對ab
所以,其中有兩個樣本點已經被確定了,
相當於有兩個樣本中的e的值是確定的, 要排除掉 -2
所以 自由度= n-2
至於自由度的公式=n-k ,
是怎么來的呢?
可以用線性代數的高斯消元法來解釋,
k是確定的參數個數, 其實就是方程組未知數的個數, 我們要求k個未知數確定
就是k個未知數有且只有唯一解,
那么消元到最后方程組個數/矩陣非0行數----m-----必須滿足 m=k,這是個充要條件
所以至少有m=k個已知樣本,或者說確定的樣本必須有k個,
所以自由度n-k.
k是限制條件的個數.
那從這個角度, 反過來再想想什么是自由呢?
我們看n個樣本,還有,n-k個樣本是未知的,
相當於還有n-k個未知數解是無窮的,這就叫自由
https://zhidao.baidu.com/question/161295692.html