功效分析
功效分析针对的是假设检验,比如:比例检验、t检验、卡方检验、平衡单因素ANOVA、相关性分析,以及线性模型分析等。
1 用pwr包做功效分析
问题描述:假设想评价使用手机对驾驶员反应时间的影响,则零假设为H0:U1-U2=0,其中U1是驾驶员使用手机时的反应时间均值,U2是驾驶员不使用手机是的反应时间(此处U1-U2即感兴趣的总体参数)。假如拒绝该零假设,备择假设或者研究假设就是H1:U1-U2!=0,即这两个条件下反应时间的均值不相等。
t检验,pwr.t.test()函数格式为:
pwr.t.test(n = NULL, d = NULL, sig.level = 0.05, power = NULL,
type = c("two.sample", "one.sample", "paired"),
alternative = c("two.sided", "less", "greater"))
n为样本大小
d为效应值,即标准化的均值之差
sig.level表示显著性水平(默认为0.05)
power为功效水平
type值检验类型,默认为双样本t检验
alternative默认指该统计检验是双侧检验
根据过去的经验知道反应时间有1.25s的标准差,并且认定1s的反应时间差值巨大,那么可以设定效应指d=1/.25=0.8甚至更大,如果差异存在,我们希望可以有90%的把握检测到它,由于随机变异性的存在,你也希望有95%得把握不会误报差异显著。
library(pwr)
pwr.t.test(d=.8,sig.level = .05,power=.9,type = "two.sample",alternative = "two.sided")
结果分析:这里需要34个人,总共两组,需要68个受试者,这样才能保证有90%的把握检测到0.8的效应值,并且最多5%的可能性误报差异存在。
2 方差分析
pwr.anova.test()函数可以对平衡单因素方差分析进行功效分析,格式如下:
pwr.anova.test(k = NULL, n = NULL, f = NULL, sig.level = 0.05, power = NUL)
k:表示组的个数
n:表示各组中样本的大小
f:表示效应值
sig.level表示显著性水平
power为功效水平
现在我们对5个组做单因素方差分析,要达到0.8的功效,效应值为0.25,并选择0.05的水平,计算各组需要的样本大小
pwr.anova.test(k=5,f=.25,sig.level = .05,power=.8)
结果分析:若达到以上的需求,总样本大小为5*39,即195。
3 相关性
pwr.r.test()函数可以对相关性分析进行进行功效分析,格式如下:
pwr.r.test(n = NULL, r = NULL, sig.level = 0.05, power = NULL,
alternative = c("two.sided", "less","greater"))
n:是观测值
r:是效应值(通过线性相关系数衡量)
研究抑郁与孤独的关系,零假设和备择假设为:H0:p≤0.25、H1:p>0.25
p是两个心里变量的总体相关性大小,设定显著性水平为0.05,而且如果H0是错误的,我们想有90%的信心拒绝H0,那么需要多少观测值呢?
pwr.r.test(r=.25,sig.level = .05,power=.9, alternative ="greater")
结果分析:若满足以上要求,我们需要134个受试者来评价抑郁和孤独的关系,以便在零假设为假的情况下有90%的信心拒绝它。
4 比例检验
当比较两个比例时,可使用pwr.2p.test()函数进行功效分析,格式为:
pwr.2p.test(h = NULL, n = NULL, sig.level = 0.05, power = NULL,
alternative = c("two.sided","less","greater"))
h是效应值
n是各组相同的样本量
当各组中n不相同时,则使用函数:
pwr.2p2n.test(h=, n1=, n2=, sig.level=, power=)
假定你对某流行药物能缓解60%使用者的症状感到怀疑。而一种更贵的新药如果能缓解65%
使用者的症状,就会被投放到市场中。此时,在研究中你需要多少受试者才能够检测到两种药物存在这一特定的差异?
假设你想有90%的把握得出新药更有效的结论,并且希望有95%的把握不会误得结论。另外,
你只对评价新药是否比标准药物更好感兴趣,因此只需用单边检验,代码如下:
pwr.2p.test(h=ES.h(.65, .6), sig.level=.05, power=.9, alternative="greater")
结果分析:若满足以上要求,在本研究中需要1605个人试用新药,1605个人试用已有药物。
5 卡方检验
卡方检验常常用来评价两个类别型变量的关系。典型的零假设是变量之间独立,备择假设是不独立。
pwr.chisq.test()函数可以评估卡方检验的功效、效应值和所需的样本大小。格式为:
pwr.chisq.test(w = NULL, N = NULL, df = NULL, sig.level = 0.05, power = NULL)
w是效应值
N是总样本大小
df是自由度
函数ES.w2(P)可以计算双因素列联表中备择假设的效应值
假设你想研究人种与工作晋升的关系,下面是统计出来的人种与工作晋升之间的比例:
prob <- matrix(c(.42, .28, .03, .07, .10, .10), byrow=TRUE, nrow=3)
ES.w2(prob) #计算效应值
pwr.chisq.test(w=.1853, df=2, sig.level=.05, power=.9)
结果分析:在既定的效应值、功效水平和显著性水平下,该研究需要369个受试者才能检验
人种与工作晋升的关系。
6 在新情况中选择合适的效应值
功效分析中,预期效应值是最难决定的参数。当面对全新的研究情况,没有任何过去的经验可借鉴时,你能做些什么呢?在行为科学领域,Cohen(1988)曾尝试提出一个基准,可为各种统计检验划分“小”“中”“大”三种效应值。