為什么樣本方差除以(n-1)而不是n ?(自由度)


  不記得第幾次看見樣本方差的公式,突然好奇為什么要除以(n-1)而不是n呢?看見一篇文章從定義上和無偏估計推導上講的很清楚https://blog.csdn.net/fuming2021118535/article/details/51290320,書上看見從自由度上作的解釋,在此記錄一下。

  自由度

  自由度是統計學中一個經常見到的重要概念。指計算某一統計量時,取值不受限制的變量個數。

  對於樣本方差來說,自由度為n-1。S2的表達式中為n個量的平方和,為何自由度只有n-1?因為x1-, ... , x2-這n個量並不能自由變化,而是受到一個約束,即,這使它的自由度少了一個,在樣本方差S2的公式中分母上是n-1,就是因為當給定均值時,x1, x2, ..., xn這n個數據中,前n-1個數據都可以自由取值,而第n個數據受到全部數據的平均值的約束,不能自由取值。第n個數據可由公式求得,因此,S2的自由度是n-1。所以,所謂“自由度”就是指可以自由取值的數據的個數,或者指不受任何約束,可以自由變動的變量的個數。

  還可以對自由度這個概念賦予另一種解釋,即一共有n個數據,有n個自由度,用S2估計總體方差σ2,自由度本應為n,但總體均值μ也未知,用去估計,用掉了一個自由度,故只剩n-1個自由度。

  用矩陣秩的概念也可以解釋自由度。自由度是對隨機變量的二次型(可稱為二次統計量)而言的,自由度就是二次型矩陣的秩。但用矩陣的秩來判斷統計量的自由度比較困難,一般采用直觀方法來做判斷,即由線性代數知識可知,一個二次型的秩為它所含變量個數減去變量間獨立線性約束條件的個數,從而便可得到統計量的自由度。關於樣本方差S2的自由度,就是因為含有n個變量,但n個變量有一個線性約束條件,故S2的自由度為n-1。

  回歸分析中,回歸方程的顯著性檢驗用到殘差平方和。確定殘差平方和的自由度的一般方法是:觀測值的個數n減去必須估計出的參數的個數就是自由度。例如p元線性回歸方程的殘差平方和的自由度就是n-p-1,因為回歸方程中有p+1個待估參數。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM