今天和大家一起探討和分下一下SPSS-非參數檢驗--K個獨立樣本檢驗 ( Kruskal-Wallis檢驗)。
還是以SPSS教程為例:
假設:HO: 不同地區的兒童,身高分布是相同的
H1: 不同地區的兒童,身高分布是不同的
不同地區兒童身高樣本數據如下所示:

提示:此樣本數為4個(北京,上海,成都 ,廣州)每個樣本的樣本量(觀察數)都為5個
即:K=4>3 n=5, 此時如果樣本逐漸增大,呈現出自由度為K-1的平方的分布,(即指:卡方檢驗)
點擊“分析”——非參數檢驗——舊對話框——K個獨立樣本檢驗,進入如下界面:

將“周歲兒童身高”變量拖入右側“檢驗變量列表”內, 將“城市(CS)變量” 拖入“分組變量”內,點擊“定義范圍” 輸入“最小值”和“最大值”(這里的變量類型必須為“數字型”)如果不是數字型,必須要先定義或者重新編碼。
在“檢驗類型”下面選擇“秩和檢驗”( Kruskal-Wallis檢驗)點擊確定
運行結果如下所示:

對結果進行分析如下:
1:從“檢驗統計量a,b”表中可以看出:秩和統計量為:13.900
自由度為:3=k-1=4-1
下面來看看“秩和統計量”的計算過程,如下所示:
假設“秩和統計量”為 kw 那么:


其中:n+1/2 為全體樣本的“秩平均” Ri./ni 為第i個樣本的秩平均 Ri.代表第i個樣本的秩和, ni代表第i個樣本的觀察數)

最后得到的公式為:

北京地區的“秩和”為: 秩平均*觀察數(N) = 14.4*5=72
上海地區的“秩和”為:8.2*5=41
成都地區的“秩和”為:15.8*5=79
廣州地區的“秩和”為:3.6*5=18

接近13.90 (由於中間的計算,我采用四舍五入,丟棄了部分數值,所以,會有部分誤差)
2:“檢驗統計量a,b”表中可以看出:“漸進顯著性為0.003, 由於0.003<0.01 所以得出結論:
H1: 不同地區的兒童,身高分布是不同的
