數值型資料不滿足正態分布,使用秩檢驗。若滿足,使用 t 檢驗。
除了對定量資料檢驗,也適用於等級資料檢驗。
秩檢驗是非參數檢驗,沒有使用數據本身,而是使用數據之間位次,因此會效能不如參數檢驗。
chisq檢驗是只用到“計量”,就是數個數,只是說組間的構成比有差異,並不能衡量差異大小。秩檢驗可以衡量,參數檢驗更能衡量。
1. 秩
就是中位數檢驗,因為中位數屬於平均數。
2. 符號檢驗
配對樣本檢驗。只保留了符號信息,損失了秩(位置)信息。
符號檢驗:計算卡方統計量,基本思想是如果只有抽樣誤差,通過比較AB兩組數據設定+-號,+ - 符號數量相差不多,計算實驗前后差值,結果記為正負,數出正負值個數。根據二項分布,計算n個樣本,p=0.5,發生n1次的概率,如果小於0.05,拒絕原假設;
Proc univariate; 看Sign 結果
3、符號秩檢驗
配對樣本檢驗。保留了秩(位置)信息。
符號秩檢驗:計算實驗前后差值,保留正負號。給差值絕對值標記大小順序排序,加上正負號。計算 + 秩的總和,計算 – 秩的總和。基本思想是檢驗差值是否來自均數為0的總體。
Proc univariate; 看Sign Rank 檢驗結果
4. Wilcoxon rank-sum 秩和檢驗 - 單因素
獨立樣本的秩和檢驗。配對樣本當然可以使用此方法,但丟掉了配對信息,因此不推薦使用。
如果反應變量是定量變量,則按數據大小排序,然后統計秩次,分組計算總秩次。
若為分類變量,直接用平均秩次,根據每行頻數算出秩次范圍,取中間數據作為平均頻次
data rnksm; input trt $ pat score @@; datalines; SER 2 0 SER 3 2 SER 5 3 SER 6 3 SER 8 -2 SER 10 1 SER 12 3 SER 14 3 SER 16 –1 SER 17 2 SER 20 -3 SER 21 3 SER 22 3 SER 24 0 SER 26 2 SER 27 –1 PBO 1 3 PBO 4 –1 PBO 7 2 PBO 9 3 PBO 11 –2 PBO 13 1 PBO 15 0 PBO 18 -1 PBO 19 -3 PBO 23 -2 PBO 25 1 PBO 28 0 ; proc npar1way wilcoxon data = rnksm; class trt; var score; run;
exact wilcoxon;
小樣本下使用exact會更精確。
4.1 Wilcoxon
單因素,且只有兩個水平。
相當於非參數獨立樣本 t 檢驗。如果滿足正態性,兩水平均值比較用 t 檢驗,如果不滿足,兩水平均值比較用 Wilcoxon秩和檢驗。
4.2 Kruskal-Wallis
單因素,且水平數量大於連個。
For larger samples (typically at least 10 per group), a normal approximation to the Wilcoxon rank sum test can be used,even for samples as small as 8-10 per group
每個group樣本量超過10,使用Z統計量(近似正態分布)。
否則使用T統計量。
若相同秩次比較多,則會在公式中加0.05進行校正。
5. Friedman
多因素,均值比較,不滿足正態性,所以不用方差分析,用Friedman檢驗
Friedman檢驗是秩的檢驗,通過 scores = rank cmh實現。
Row Mean Scores Differ就是Friedman檢驗。
data dat1O; do block=1 to 12; do treat= 1 to 3; input x @@; output; end; end; datalines; 48.02 71.90 66.27 52.70 56.35 60.59 60.22 70.08 66.12 44.49 86.60 55.36 49.31 68.25 53.39 46.23 63.36 52.34 55.16 66.12 55.16 42.48 70.02 58.64 50.84 66.97 44.01 39.38 67.05 52.49 45.16 69.89 59.99 53.47 61.08 61.08 ; proc freq data = dat1O; tables block*treat*x/noprint scores=rank cmh2; run;
多因素,也就是區塊設計。cmh2就是輸出CMH中前兩個統計量,總共三個。