Kolmogorov-Smirnov檢驗(K-S檢驗)基於累積分布函數,用以檢驗一個經驗分布是否符合某種理論分布或比較兩個經驗分布是否有顯著性差異。
兩樣本K-S檢驗由於對兩樣本的經驗分布函數的位置和形狀參數的差異都敏感而成為比較兩樣本的最有用且常規的非參數方法之一。
優點:該檢驗不依賴於要測試的累積分布函數,相比於卡方擬合檢驗(卡方檢驗需要50個以上的樣本),不需要大量的樣本。
缺點:只適用於連續分布;在分布中間敏感,在兩端不夠敏感;最大的局限在於整個分布需要完全確定,如果位置,形狀等參數都是從數據中估計的,判定區間不再有效,因此這些參數一般只能通過模擬得到。
因此很多人推薦使用以下兩種檢驗方法,這兩種方法也是ks檢驗的改進版本。
Anderson-Darling test in R package of robCompositions
Shapiro-Wilk test in R package of mvShapiroTest
參考文獻1-3為方法介紹,文獻4為中文介紹,其中有兩樣本ks檢驗的R使用。文獻5為Shapiro-Wilk檢驗的介紹
參考文獻:
1、http://itl.nist.gov/div898/handbook/eda/section3/eda35g.htm
2、http://www.physics.csbsju.edu/stats/KS-test.html
3、https://en.wikipedia.org/wiki/Kolmogorov%E2%80%93Smirnov_test
4、http://wenku.baidu.com/link?url=RIltudkzYckW6NAJDHZ1MOG5KDqpbf85_ASiKUtdwtLZfE4UvU_-w4AAd3-5eL-P3WTG2A2FHgC_0-AIMvKxxhOk_r3l6P_yBbSpmCaaFNO
5、http://blog.sina.com.cn/s/blog_403aa80a01019lwd.html
6、http://www.cnblogs.com/hdu-2010/p/4629675.html