t 检验+R语言第九章方差分析+相关性图+主成分分析


用MASS包中的UScrime数据集

一、

1.独立样本的t检验

我们比较的对象是南方和非南方各州,因变量为监禁的概率。一个针对两组的独立样本t检验可以用于检验两个总体的均值相等的假设。

library(MASS)
t.test(Prob~So,data=UScrime)

2 非独立样本的t检验

library(MASS)
sapply(UScrime[c("U1","U2")],function(x)(c(mean=mean(x),sd=sd(x))))

 with(UScrime,t.test(U1,U2,paired=TRUE))

3.多于两组的情:使用方差分析(ANOVA)

二、

组间差异的非参数检验:结果变量在本质上就严重偏倚或呈现有序关系

4.两组的比较

若两组数据独立,可以使用Wilcoxon秩和检验(更广为人知的名字是Mann–Whitney U检验)
with(UScrime,by(Prob,So,median))
wilcox.test(Prob~So,data=UScrime)

 

 5.多于两组的比较

如果各组独立,则Kruskal—Wallis检验将是一种实用的方法。

states<-as.data.frame(cbind(state.region,state.x77))

kruskal.test(Illiteracy~state.region,data=states)

 

 第八章回归

1.拟合并解释线性模型
2.检验模型假设
3.模型选择

用一个或多个预测变量(也称自变量或解释变量)来预测响应变量(也称因变量、效标变量或结果变量)的方法。
预测一个人在跑步机上锻炼时预期消耗的卡路里数。
 
第九章方差分析
 
方差分析主要通过F检验来进行效果评测,若治疗方案的F检验显著,则说明五个星期后两种疗法的STAI得分均值不同。

单因素方差

library(multcomp)

attach(cholesterol)

table(trt)

aggregate(response,by=list(trt),FUN=mean)

aggregate(response,by=list(trt),FUN=sd)

fit<-aov(response~trt)

summary(fit)

带有置信区间的组均值图形

 install.packages("gplots")

library(gplots)

plotmeans(response~trt,xlab="Treatment",ylab="Response",main="Mean Plot\nwith95% CI")

detach(cholesterol)

#多重比较(没做出来)

 install.packages("multcomp")

library(multcomp)

par(mar=c(5,4,6,2))

tuk<-glht(fit,linfct=mcp(trt="Tukey"))

plot(cld(tuk,level=0.5),col="lightgrey')

TukeyHSD(fit)

install.packages("carData")

library(car)

qqplot(lm(response~trt,data=cholesterol),simulate=TRUE,main="Q-Q plot",labels=FALSE)

 

setwd("E:/rdata")

read.csv("土培11.csv")

a<-read.csv("土培11.csv")

head(a)

 

 fit<-aov(根干重~根数,data=a)

summary(fit)

 

#多元方差分析
单因素多元方差分析

library(MASS)

attach(UScereal)

y<-cbind(calories,fat,sugars)#cbind()函数将三个因变量(卡路里、脂肪和糖)合并成一个矩阵

aggregate(y,by=list(shelf),FUN=mean)#aggregate()函数可获取货架的各个均值,cov()则输出各谷物间的方差和协方差。

cov(y)

fit<-manova(y~shelf)     #manova()函数能对组间差异进行多元检验。

summary(fit)

summary.aov(fit)

 

 

 相关图

option(digits=2)

cor(mtcars)

install.packages("corrgram")

library(corrgram)

corrgram(mtcars,order=TRUE,lower.panel=panel.shade,

upper.panel=panel.pie,text.panel=panel.txt,

main="Correlogram of mtcars intercorrelations")

 

 

corrgram(a,order=TRUE,lower.panel=panel.shade,

upper.panel=panel.pie,text.panel=panel.txt,

main="根系指标相关性的相关图 ")

 

 

蓝色和从左下指向右上的斜杠表示单元格中的两个变量呈正相关。反过来,红色和从左上指向右下的斜杠。表示变量呈负相关。色彩越深,饱和度越高,说明变量相关性越大。
主成分分析
判断主成分的个数
library(psych)
library(psych)
fa.parallel(Harman23.cor$cov,n.ob=302,fa="pc",n.iter=100,show.legend=FALSE,main="Scree plot parallel analysis")
fa.parallel(a,n.ob=302,fa="pc",n.iter=100,show.legend=FALSE,main="PCA个数")   

 

 

library(psych)
pc<-principal(a[,-1],nfactors=1)
pc
提取主成分,nfactor设定主成分数


 

 

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM