功效分析
功效分析針對的是假設檢驗,比如:比例檢驗、t檢驗、卡方檢驗、平衡單因素ANOVA、相關性分析,以及線性模型分析等。
1 用pwr包做功效分析
問題描述:假設想評價使用手機對駕駛員反應時間的影響,則零假設為H0:U1-U2=0,其中U1是駕駛員使用手機時的反應時間均值,U2是駕駛員不使用手機是的反應時間(此處U1-U2即感興趣的總體參數)。假如拒絕該零假設,備擇假設或者研究假設就是H1:U1-U2!=0,即這兩個條件下反應時間的均值不相等。
t檢驗,pwr.t.test()函數格式為:
pwr.t.test(n = NULL, d = NULL, sig.level = 0.05, power = NULL,
type = c("two.sample", "one.sample", "paired"),
alternative = c("two.sided", "less", "greater"))
n為樣本大小
d為效應值,即標准化的均值之差
sig.level表示顯著性水平(默認為0.05)
power為功效水平
type值檢驗類型,默認為雙樣本t檢驗
alternative默認指該統計檢驗是雙側檢驗
根據過去的經驗知道反應時間有1.25s的標准差,並且認定1s的反應時間差值巨大,那么可以設定效應指d=1/.25=0.8甚至更大,如果差異存在,我們希望可以有90%的把握檢測到它,由於隨機變異性的存在,你也希望有95%得把握不會誤報差異顯著。
library(pwr)
pwr.t.test(d=.8,sig.level = .05,power=.9,type = "two.sample",alternative = "two.sided")
結果分析:這里需要34個人,總共兩組,需要68個受試者,這樣才能保證有90%的把握檢測到0.8的效應值,並且最多5%的可能性誤報差異存在。
2 方差分析
pwr.anova.test()函數可以對平衡單因素方差分析進行功效分析,格式如下:
pwr.anova.test(k = NULL, n = NULL, f = NULL, sig.level = 0.05, power = NUL)
k:表示組的個數
n:表示各組中樣本的大小
f:表示效應值
sig.level表示顯著性水平
power為功效水平
現在我們對5個組做單因素方差分析,要達到0.8的功效,效應值為0.25,並選擇0.05的水平,計算各組需要的樣本大小
pwr.anova.test(k=5,f=.25,sig.level = .05,power=.8)
結果分析:若達到以上的需求,總樣本大小為5*39,即195。
3 相關性
pwr.r.test()函數可以對相關性分析進行進行功效分析,格式如下:
pwr.r.test(n = NULL, r = NULL, sig.level = 0.05, power = NULL,
alternative = c("two.sided", "less","greater"))
n:是觀測值
r:是效應值(通過線性相關系數衡量)
研究抑郁與孤獨的關系,零假設和備擇假設為:H0:p≤0.25、H1:p>0.25
p是兩個心里變量的總體相關性大小,設定顯著性水平為0.05,而且如果H0是錯誤的,我們想有90%的信心拒絕H0,那么需要多少觀測值呢?
pwr.r.test(r=.25,sig.level = .05,power=.9, alternative ="greater")
結果分析:若滿足以上要求,我們需要134個受試者來評價抑郁和孤獨的關系,以便在零假設為假的情況下有90%的信心拒絕它。
4 比例檢驗
當比較兩個比例時,可使用pwr.2p.test()函數進行功效分析,格式為:
pwr.2p.test(h = NULL, n = NULL, sig.level = 0.05, power = NULL,
alternative = c("two.sided","less","greater"))
h是效應值
n是各組相同的樣本量
當各組中n不相同時,則使用函數:
pwr.2p2n.test(h=, n1=, n2=, sig.level=, power=)
假定你對某流行葯物能緩解60%使用者的症狀感到懷疑。而一種更貴的新葯如果能緩解65%
使用者的症狀,就會被投放到市場中。此時,在研究中你需要多少受試者才能夠檢測到兩種葯物存在這一特定的差異?
假設你想有90%的把握得出新葯更有效的結論,並且希望有95%的把握不會誤得結論。另外,
你只對評價新葯是否比標准葯物更好感興趣,因此只需用單邊檢驗,代碼如下:
pwr.2p.test(h=ES.h(.65, .6), sig.level=.05, power=.9, alternative="greater")
結果分析:若滿足以上要求,在本研究中需要1605個人試用新葯,1605個人試用已有葯物。
5 卡方檢驗
卡方檢驗常常用來評價兩個類別型變量的關系。典型的零假設是變量之間獨立,備擇假設是不獨立。
pwr.chisq.test()函數可以評估卡方檢驗的功效、效應值和所需的樣本大小。格式為:
pwr.chisq.test(w = NULL, N = NULL, df = NULL, sig.level = 0.05, power = NULL)
w是效應值
N是總樣本大小
df是自由度
函數ES.w2(P)可以計算雙因素列聯表中備擇假設的效應值
假設你想研究人種與工作晉升的關系,下面是統計出來的人種與工作晉升之間的比例:
prob <- matrix(c(.42, .28, .03, .07, .10, .10), byrow=TRUE, nrow=3)
ES.w2(prob) #計算效應值
pwr.chisq.test(w=.1853, df=2, sig.level=.05, power=.9)
結果分析:在既定的效應值、功效水平和顯著性水平下,該研究需要369個受試者才能檢驗
人種與工作晉升的關系。
6 在新情況中選擇合適的效應值
功效分析中,預期效應值是最難決定的參數。當面對全新的研究情況,沒有任何過去的經驗可借鑒時,你能做些什么呢?在行為科學領域,Cohen(1988)曾嘗試提出一個基准,可為各種統計檢驗划分“小”“中”“大”三種效應值。