一、概念、條件及目的
1.概念
要理解樣本方差的自由度為什么是n-1,得先理解自由度的概念:
自由度,是指附加給獨立的觀測值的約束或限制的個數,即一組數據中可以自由取值的個數。
2.成立條件
所謂自由取值,是指抽樣時選取樣本,也就是說:只有當以樣本的統計量來估計總體的參數時才有自由度的概念,直接統計總體參數時是沒有自由度概念的。
3.目的
自由度概念,是為了在通過樣本進行參數估計時,剔除系統誤差,實現無偏估計。
設A'=g(X1,X2,...,Xn)是未知參數A的一個點估計量,若A'滿足E(A')= A ,則稱A'為A的無偏估計量,否則為有偏估計量。所以,無偏估計就是系統誤差為零的估計。
如果看完以上釋義仍覺得有些晦澀難懂,可以閱讀下知乎上生動的解說,查看排第一的回答即可,附上鏈接:
https://www.zhihu.com/question/22983179
二、詳解自由度
當樣本數據的個數為n時,若樣本平均數 x拔 確定后,則附加給n個觀測值的約束個數就是1個,一次只有n-1個數據可以自由取值,其中必有一個數據不能自由取值。按照這一邏輯,如果對n個觀測值附加的約束個數為k個,自由度則為n-k。例如假設樣本有3個值,即x1=2,x2=4,x3=9,則當 x拔 =5確定后,x1、x2、x3只有兩個數據可以自由取值,另一個則不能自由取值,比如x1=6,x2=7,那么x3必然取2,而不能取其他值。
樣本方差自由度為什么為n-1呢,因為在計算離差平方和 ∑(xi -x)2 時,必須先求出樣本平均數 x拔,而 x拔 則是附加給 ∑(xi -x)2 的一個約束,因此,計算離差平方和時只有n-1個獨立的觀測值,而不是n個。
三、公式推導
有興趣的,可以參考果殼網的博文,附上鏈接
http://www.guokr.com/question/468100/
