定義
Mann-Whitney 秩和檢驗,也被稱為 Mann-Whitney-U 檢驗,是另一類非參數檢驗方法,它們不對數據分布作特殊假設,因而能適用於更復雜的數據分布情況。
秩和檢驗的做法是,首先將兩類樣本混合在一起,對所有樣本按照所考察的特征從小到大排序。在兩類樣本中分別計算所得排序序號之和T1 和T2 ,稱作秩和。兩類的樣本數分別是n1個和n2。秩和檢驗的基本思想是,如果一類樣本的秩和顯著地比另一類小(或大),則兩類樣本在所考察的特征上有顯著差異。秩和檢驗的統計量就是某一類(如第一類,秩和為T1)的秩和為了比較兩類樣本的秩和是否差異顯著,需要比較T分布,當樣本數目較大時,人們可以用正態分布來近似秩和T1 的分布。
實例 & 代碼
研究不同飼料對雌鼠體重增加是否有差異,數據表如下表所示(顯著性水平為0.05):
飼料 | 鼠數 | 各鼠增加的體重/g |
---|---|---|
高蛋白 | 12 | 134,146,104,119,124,61,107,83,113,129,97,123 |
低蛋白 | 7 | 70,118,101,85,112,132,94 |
import scipy.stats as stats
weight_high=[134,146,104,119,124,161,107,83,113,129,97,123]
weight_low=[70,118,101,85,112,132,94]
stats.mannwhitneyu(weight_high,weight_low,alternative='two-sided')
結果解釋
結果如下:
MannwhitneyuResult ( statistic = 62.0, pvalue = 0.09934224785346528 )
由於p值大於0.05,故可以認為沒有顯著差異。
參數說明
- x, y:array_like
樣本數據數組 - use_continuity:bool, optional
是否需要0.5的連續性校正,建議小樣本需要。默認值為 True 。 - alternative:{None, ‘less’, ‘two-sided’, ‘greater’}, optional
‘two-sided’ 表示雙側檢驗,‘greater’ 為備擇假設是大於的單邊檢驗,‘less’ 為備擇假設是小於的單邊檢驗,None 表示雙側檢驗 p 值的一半。默認值為 None 。