自由度


首先,你先不要想統計的知識,我們講一個平時生活里的例子,比如你是一個非常喜歡鞋子的人,你每個禮拜每一天都想穿上不一樣的鞋子,比如周一穿高跟鞋,周二穿運動鞋,等等。
但是你只有7雙鞋,所以,在禮拜一的時候,你可以在7雙鞋子里隨便挑一雙穿,到了禮拜二,你可以在剩下的6雙里面挑一雙穿,到了禮拜六,只剩下2雙給你挑了,過完禮拜六,只剩下一雙鞋了,你只能穿這雙,因為你沒有其他的鞋子可以挑了。所以,這7雙鞋子里面,你能夠自由挑選的是 7-1 = 6雙。

T test 的degree of freedom

回到統計中的自由度。有一組數需要填入10個數字,假設沒有任何約束,你可以填寫任何的數。但是如果我告訴你,你填的這些數的平均值必須是6.5。那這10個數,你會怎么填呢?
前9個數,你可以隨機填寫:
舉例一: 40, -2.3, -31, -86, 5, 6, 7, -16, 105
舉例二: 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1, 1.1, 1.2
但到了第十個數,你就不能隨機填寫了,由於這10個數的平均數是6.5,所以第十個數必須是:
舉例一: 40, -2.3, -31, -86, 5, 6, 7, -16, 105 -> 第十個數必須是 37.3
舉例二: 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1, 1.1, 1.2 -> 第十個數必須是 57.8
你有沒有注意到,這10個數的,你能夠隨機填寫的是10-1=9個數。一旦確定有平均數存在,無論是幾個數,你能夠自由填寫的都是n-1。我們說有n-1的自由度,n是樣本量。

Chi-Square Test 的degree of freedom

我們看一下另一個情景,卡方檢驗是用來檢驗分類變量是否是獨立的一種檢驗方式。在這個檢驗中,自由度是指在contingency 表可以自由填寫的數,同時這個contingency表也有自己的約束,即每行每列的加總是定值。每個空格內的數,是這個現象觀察到的次數。

下面是一個2*2的contingency table:

  吸煙 不吸煙 Total
  170
    80
Total 150 100  

你有沒有發現,當你填了一個數后,剩下的3個數,就已經事先由每行或每列加總的數決定好了。比如我在男吸煙那里天了120,那么利用Total的值我們可以得出:男不吸煙顯然是 170 - 120 = 50, 女吸煙是 150 - 120 = 30, 女不吸煙是 100 - 50 = 50

同樣,我們再看一下2*3的contingency table:

  愛打牌 愛打游戲 愛打麻將 Total
  170
      130
Total 150 100 50  

這個例子中,只要填了2個值,剩下的4個數的數值也可以同時計算出來。
總結以上的例子,如果我們有r行,c列的表格,我們可以自由填寫的有(r-1)(c-1)個數,這就是卡方檢驗的自由度計算公式。



來源:簡書
原文鏈接:https://www.jianshu.com/p/0032087b9dbb


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM