初始數據類似:
蛋白質組數據雖不是嚴格的正態分布,但目前最常用的檢驗方法還是T檢驗(兩組比較)和方差分析(多組比較)。這個話題值得深究,這里不展開。
主要是求多個蛋白的Pvalue值或FDR,用於差異篩選。
Pvalue <- c()
type<-factor(c(rep("S01CC",3),rep("S11SC",3),rep("S12CC",3),rep("S12SC",3)))
for(i in 1:nrow(exp)){
if(sum(exp[i,1:3])==0 && sum(exp[i,4:6])==0 && sum(exp[i,7:9])==0 && sum(exp[i,9:12])==0){
Pvalue[i] <- "NA"
}else{
y=aov(as.numeric(exp[i,1:12]) ~ type)
Pvalue[i]<-summary(y)[[1]][,5][1]
# Pvalue[i]<-summary(y)[[1]][,"Pr(>F)"][1]
}
}
FDR=p.adjust(Pvalue, "BH")
out<-cbind(exp,Pvalue,FDR)
write.csv(out,"anova_out.csv",row.names = T)