不符合正態分布的配對數據也有自己的統計方法。
1.在觀察到數據不符合正態分布后,首先要考慮是否是離群值或者極值的影響,也就是說某個或少數個體對整體分布影響很大。如果有要認真分析其產生原因,客觀地判斷這些樣本是否要剔除(不要為了湊正態而隨便剔)
2.如果排除上面的原因,接下來應該考慮:能否經過數據轉換來達到正態分布。最簡單的例子比如抗體滴度,這種數據一般都是指數分布的,把數據轉換成指數后也許能符合正態分布。舉例:10,100,1000,以10為底指數化以后就成為1,2,3。數據轉換有很多方法,比較常見的就是對數化了,當然也有別的。
3.如果沒法通過數據轉換符合正態分布,也不是就沒法分析了。還可以使用非參數檢驗的方法。比如Wilcoxon符號秩和檢驗。
關鍵在於忠於數據的真實性,不要硬套某一種方法。如果數據不符合正態還要用t檢驗的話,得出的結果反而是不可信的。其實非參也不錯的,雖然不是首選,但檢驗效能並不比參數檢驗(比如t檢驗)低很多,尤其是數據不符合參數檢驗要求時,更是不錯的選擇。
附:各非參數統計檢驗中所需樣本(N)及處理組數(k)至少應該要多大?
Wilcoxon 符號秩檢驗
N>15
Mann–Whitney U檢驗
N1=3 或 4 且 N2>12; N1>4 且 N2>10
Kruskal–Wallis H檢驗
k>3 且所有的N>5
Friedman檢驗(方差分析)
k=3: N>13; k=4: N>8;k=5: N>5; k>5
符號檢驗
N>35