怎么知道組之間是否有顯著性差異?
方法:單因素方差分析;雙尾檢驗;K-S檢驗;x²檢驗;蒙特卡羅檢驗
1 K-S檢驗法介紹:
有人首先想到單因素方差分析或雙尾檢驗(2 tailed TEST)。其實這些是不准確的,最好采用Kolmogorov-Smirnov test(柯爾莫諾夫-斯米爾諾夫檢驗)來分析變量是否符合某種分布或比較兩組之間有無顯著性差異。(https://www.cnblogs.com/sddai/p/5737408.html)
K-S檢驗是統計學中在對一組數據進行統計分析是所用到的一種方法。它原理是比較觀測頻率分布和某一“標准”的頻率分布,確定觀測分布模式的顯著性。它是將需要做統計分析的數據和另一組標准數據(如點數據樣本與完全隨機模式CSR進行對比)進行對比,求得它和標准數據之間的偏差的方法。
一般在K-S檢驗中,首先假設兩個頻率分布十分相似,如果兩個頻率分布的差異非常小,這種差異的出現存在偶然性;如果差異大,偶然發生的可能性就小。再計算需要做樣本數據與標准數據的累積分布函數,然后求這兩個累積分布函數的差的絕對值中的最大值D。最后通過查K-S檢定表以確定D值是否落在所要求對應的置信區間內。若D值落在了對應的置信區間內,說明樣本數據與標准數據或另一組對比數據沒有顯著差異。反之亦然。
1.2 簡言步驟之(改https://blog.csdn.net/ljzology/article/details/80407704):
(1)提出假設H0:Fn(x)=F(x)
(2)給定一個顯著水平α,例如100次試驗中只有5次出現機會,則α=0.05
(3)計算樣本累計頻率與理論分布累計概率的絕對差,令最大的絕對差為Dn;Dn=max{[Fn(x) - F(x)]}
(4)用樣本容量n和顯著水平α查出臨界值Dna;
或者用D 0.05的經驗算法判斷,計算作為比較基礎的門限值,即;如果是兩個樣本模式比較,則
(5)如果計算得出的D值大於Dα= 0.05這一閾值,可得出兩個分布的差異在統計意義上是顯著的。
(6)不過大多數軟件如CLAMPFIT,MINIANALYSIS統計出來的結果都是直接有P值。根據這個值(alpha=0.05)就可以斷定有沒有差異了。(https://www.cnblogs.com/sddai/p/5737408.html)
1.3 實例:
【引申】—— 累積分布函數(cumulative distribution function,簡寫CDF)定義:對連續函數,所有小於等於a的值,其出現概率的和。F(a)=P(x<=a)
除了K-S檢驗外,還有x²檢驗和蒙特卡羅檢驗。