13--泊松回归


泊松回归

当通过一系列连续型和/或类别型预测变量来预测计数型结果变量时,泊松回归是一个非常有用的工具。为阐述泊松回归模型的拟合过程,并探讨一些可能出现的问题,我们将使用robust包中的Breslow癫痫数据(Breslow1993)。特别地,我们将讨论在治疗初期的八周内,抗癫痫药物对癫痫发病数的影响。

我们就遭受轻微或严重间歇性癫痫的病人的年龄和癫痫发病数收集了数据,包含病人被随机分配到药物组或者安慰剂组前八周和随机分配后八周两种情况。响应变量为sumY(随机化后八周内癫痫发病数),预测变量为治疗条件(Trt)、年龄(Age)和前八周内的基础癫痫发病数(Base)。之所以包含基础癫痫发病数和年龄,是因为它们对响应变量有潜在影响。在解释这些协变量后,我们感兴趣的是药物治疗是否能减少癫痫发病数。

首先,看看数据集的统计汇总信息:

data(breslow.dat, package="robust")    #加载数据集breslow.dat

names(breslow.dat)     #查看该数据集中的变量名字

 

summary(breslow.dat[c(6,7,8,10)])     #列出需要的列之间的关系,R语言中索引从1开始

 

结果分析:基础和随机化后的癫痫发病数都有很高的偏度。现在,我们更详细地考察响应变量。

opar <- par(no.readonly=TRUE)

par(mfrow=c(1,2))

attach(breslow.dat)

hist(sumY, breaks=20, xlab="Seizure Count", main="Distribution of Seizures")

#hist绘制柱状图,breaks是一个提供直方图单元之间断点的向量,为了使柱状图绘制的更好看。

boxplot(sumY ~ Trt, xlab="Treatment", main="Group Comparisons")

#boxplot绘制箱线图

par(opar)

 

接下来拟合泊松回归:

fit <- glm(sumY ~ Base + Age + Trt, data=breslow.dat, family=poisson())

summary(fit)

 

结果分析:输出结果列出了偏差、回归参数和参数为0的检验。注意,此处预测变量在p<0.05的水平下都非常显著。

解释模型参数:使 coef() 函数可获取模型系数,或者调用 summary() 函数的输出结果中的Coefficients表格:

 

将系数进行指数化:

 

结果分析:现在可以看到,保持其他变量不变,年龄增加一岁,期望的癫痫发病数将乘以1.023。这意味着年龄的增加与较高的癫痫发病数相关联。更为重要的是,一单位Trt的变化(即从安慰剂到治疗组),期望的癫痫发病数将乘以0.86,也就是说,保持基础癫痫发病数和年龄不变,服药组相对于安慰剂组癫痫发病数降低了20%


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM