t 檢驗+R語言第九章方差分析+相關性圖+主成分分析


用MASS包中的UScrime數據集

一、

1.獨立樣本的t檢驗

我們比較的對象是南方和非南方各州,因變量為監禁的概率。一個針對兩組的獨立樣本t檢驗可以用於檢驗兩個總體的均值相等的假設。

library(MASS)
t.test(Prob~So,data=UScrime)

2 非獨立樣本的t檢驗

library(MASS)
sapply(UScrime[c("U1","U2")],function(x)(c(mean=mean(x),sd=sd(x))))

 with(UScrime,t.test(U1,U2,paired=TRUE))

3.多於兩組的情:使用方差分析(ANOVA)

二、

組間差異的非參數檢驗:結果變量在本質上就嚴重偏倚或呈現有序關系

4.兩組的比較

若兩組數據獨立,可以使用Wilcoxon秩和檢驗(更廣為人知的名字是Mann–Whitney U檢驗)
with(UScrime,by(Prob,So,median))
wilcox.test(Prob~So,data=UScrime)

 

 5.多於兩組的比較

如果各組獨立,則Kruskal—Wallis檢驗將是一種實用的方法。

states<-as.data.frame(cbind(state.region,state.x77))

kruskal.test(Illiteracy~state.region,data=states)

 

 第八章回歸

1.擬合並解釋線性模型
2.檢驗模型假設
3.模型選擇

用一個或多個預測變量(也稱自變量或解釋變量)來預測響應變量(也稱因變量、效標變量或結果變量)的方法。
預測一個人在跑步機上鍛煉時預期消耗的卡路里數。
 
第九章方差分析
 
方差分析主要通過F檢驗來進行效果評測,若治療方案的F檢驗顯著,則說明五個星期后兩種療法的STAI得分均值不同。

單因素方差

library(multcomp)

attach(cholesterol)

table(trt)

aggregate(response,by=list(trt),FUN=mean)

aggregate(response,by=list(trt),FUN=sd)

fit<-aov(response~trt)

summary(fit)

帶有置信區間的組均值圖形

 install.packages("gplots")

library(gplots)

plotmeans(response~trt,xlab="Treatment",ylab="Response",main="Mean Plot\nwith95% CI")

detach(cholesterol)

#多重比較(沒做出來)

 install.packages("multcomp")

library(multcomp)

par(mar=c(5,4,6,2))

tuk<-glht(fit,linfct=mcp(trt="Tukey"))

plot(cld(tuk,level=0.5),col="lightgrey')

TukeyHSD(fit)

install.packages("carData")

library(car)

qqplot(lm(response~trt,data=cholesterol),simulate=TRUE,main="Q-Q plot",labels=FALSE)

 

setwd("E:/rdata")

read.csv("土培11.csv")

a<-read.csv("土培11.csv")

head(a)

 

 fit<-aov(根干重~根數,data=a)

summary(fit)

 

#多元方差分析
單因素多元方差分析

library(MASS)

attach(UScereal)

y<-cbind(calories,fat,sugars)#cbind()函數將三個因變量(卡路里、脂肪和糖)合並成一個矩陣

aggregate(y,by=list(shelf),FUN=mean)#aggregate()函數可獲取貨架的各個均值,cov()則輸出各谷物間的方差和協方差。

cov(y)

fit<-manova(y~shelf)     #manova()函數能對組間差異進行多元檢驗。

summary(fit)

summary.aov(fit)

 

 

 相關圖

option(digits=2)

cor(mtcars)

install.packages("corrgram")

library(corrgram)

corrgram(mtcars,order=TRUE,lower.panel=panel.shade,

upper.panel=panel.pie,text.panel=panel.txt,

main="Correlogram of mtcars intercorrelations")

 

 

corrgram(a,order=TRUE,lower.panel=panel.shade,

upper.panel=panel.pie,text.panel=panel.txt,

main="根系指標相關性的相關圖 ")

 

 

藍色和從左下指向右上的斜杠表示單元格中的兩個變量呈正相關。反過來,紅色和從左上指向右下的斜杠。表示變量呈負相關。色彩越深,飽和度越高,說明變量相關性越大。
主成分分析
判斷主成分的個數
library(psych)
library(psych)
fa.parallel(Harman23.cor$cov,n.ob=302,fa="pc",n.iter=100,show.legend=FALSE,main="Scree plot parallel analysis")
fa.parallel(a,n.ob=302,fa="pc",n.iter=100,show.legend=FALSE,main="PCA個數")   

 

 

library(psych)
pc<-principal(a[,-1],nfactors=1)
pc
提取主成分,nfactor設定主成分數


 

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM