『原創』統計建模與R軟件-第七章方差分析

本文轉載自查看原文 2016-01-20 11:16 3733 R語言

摘要: 本文由digging4發表於：http://www.cnblogs.com/digging4/p/5091536.html

統計建模與R軟件-第七章方差分析

7.1 三個工廠生產同一種零件，現從各廠產品中分別抽取4件產品作檢測，其檢測強度如表7.25所示。

表7.25 產品檢測數據

工廠	零件強度
甲	115 116 98 83
乙	103 107 118 116
丙	73 89 85 97

（1）對數據作方差分析，判斷三個廠的產品的零件強度是否有顯著差異

（2）求每個工廠生產產品零件強度的均值，作出相應的區間估計（\(\alpha=0.05\)）

（3）對數據作多重檢驗。

df <- data.frame(X = c(115, 116, 98, 83, 103, 107, 118, 116, 73, 89, 85, 97), 
    A = gl(3, 4))

fit.aov <- aov(X ~ A, data = df)
summary(fit.aov)

##             Df Sum Sq Mean Sq F value Pr(>F)  
## A            2   1304     652    4.92  0.036 *
## Residuals    9   1192     132                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

# 由於P值為0.036，小於0.05，因此認為因素A（三個廠）對零件強度有顯著差異。
plot(df$X ~ df$A)

# 從箱線圖也可以看出三個工廠的零件強度有顯著差異。

# 對三個廠的零件強度求均值及其區間估計
mean.1 <- mean(df$X[df$A == 1])
mean.1.t <- t.test(df$X[df$A == 1], conf.level = 0.95)
mean.2 <- mean(df$X[df$A == 2])
mean.2.t <- t.test(df$X[df$A == 2], conf.level = 0.95)
mean.3 <- mean(df$X[df$A == 3])
mean.3.t <- t.test(df$X[df$A == 3], conf.level = 0.95)

reulst <- data.frame(A = c(1, 2, 3), mean = c(mean.1, mean.2, mean.3), t.test.down = c(mean.1.t[4]$conf.int[1], 
    mean.2.t[4]$conf.int[1], mean.3.t[4]$conf.int[1]), t.test.up = c(mean.1.t[4]$conf.int[2], 
    mean.2.t[4]$conf.int[2], mean.3.t[4]$conf.int[2]))
reulst

##   A mean t.test.down t.test.up
## 1 1  103       78.04     128.0
## 2 2  111       99.60     122.4
## 3 3   86       70.09     101.9


# 對數據做多重檢驗
pairwise.t.test(df$X, df$A, p.adjust.method = "none")

## 
## 	Pairwise comparisons using t tests with pooled SD 
## 
## data:  df$X and df$A 
## 
##   1     2    
## 2 0.351 -    
## 3 0.066 0.013
## 
## P value adjustment method: none

# 可以看到1和2的p值為0.351，可認為兩水平無差異。
# 1和3的P值0.066有差異，不顯著；2和3的P值0.013，差異顯著。
# 結論為工廠丙的零件強度與其他兩個廠有顯著差異，甲乙兩廠無差異。

7.2有四種產品，\(A_i,i=1,2,3\)分別為國內甲、乙、丙三個工廠生產的產品，\(A_4\)國外同類產品，現從各廠分別取10,6,6和2個產品做300小時連續磨損老化試驗，得變化率如表7.26所示，假定各廠產品試驗變化率服從等方差的正態分布。

表7.26 磨損老化試驗數據

產品	變化率
\(A_1\)	20 18 19 17 15 16 13 18 22 17
\(A_2\)	26 19 26 28 23 25
\(A_3\)	24 25 18 22 27 24
\(A_4\)	12 14

（1）試問四個廠生產的產品的變化率是否有顯著差異？

（2）若有差異，請做進一步的檢驗。i）國內產品與國外產品有無顯著差異？ii）國內各廠家的產品有無顯著差異？

df <- data.frame(X = c(20, 18, 19, 17, 15, 16, 13, 18, 22, 17, 26, 19, 26, 28, 
    23, 25, 24, 25, 18, 22, 27, 24, 12, 14), A = factor(rep(1:4, c(10, 6, 6, 
    2))))
fit.aov <- aov(X ~ A, data = df)
summary(fit.aov)

##             Df Sum Sq Mean Sq F value  Pr(>F)    
## A            3    346   115.3    14.7 2.8e-05 ***
## Residuals   20    157     7.9                    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

# P值為2.8e-05，可認為四個廠生產的產品的變化率有顯著差異
# 國內產品與國外產品有無顯著差異？ 將國內產品看做一類，國外產品看做另一類
df2 <- data.frame(X = c(20, 18, 19, 17, 15, 16, 13, 18, 22, 17, 26, 19, 26, 
    28, 23, 25, 24, 25, 18, 22, 27, 24, 12, 14), A = factor(rep(1:2, c(22, 2))))
fit.aov2 <- aov(X ~ A, data = df2)
summary(fit.aov2)

##             Df Sum Sq Mean Sq F value Pr(>F)  
## A            1    117   117.3    6.69  0.017 *
## Residuals   22    386    17.5                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

# p值為0.017，可認為國內產品與國外產品有顯著差異

# 國內各廠家的產品有無顯著差異？
fit.aov3 <- aov(X ~ A, data = df[df$A != 4, ])
summary(fit.aov3)

##             Df Sum Sq Mean Sq F value  Pr(>F)    
## A            2    229   114.3      14 0.00018 ***
## Residuals   19    155     8.2                    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

# p值為0.00018，可認為國內各廠家的產品有顯著差異

7.3某單位在大白鼠營養試驗中，隨機將大白鼠分為三組，測得每組12只大白鼠尿中氨氮的排出量\(X(mg/6d)\)，數據由表7.27所示，試對該資料做正態性檢驗和方差齊性檢驗。

表7.27 白鼠尿中氨氮檢測數據

白鼠	大白鼠營養試驗中各組大鼠尿氨氮排出量\(X(mg/6d)\)
第一組	30 27 35 35 29 33 32 36 26 41 33 31
第二組	43 45 53 44 51 53 54 37 47 57 48 42
第三組	82 66 66 86 56 52 76 83 72 73 59 53

rat <- data.frame(X = c(30, 27, 35, 35, 29, 33, 32, 36, 26, 41, 33, 31, 43, 
    45, 53, 44, 51, 53, 54, 37, 47, 57, 48, 42, 82, 66, 66, 86, 56, 52, 76, 
    83, 72, 73, 59, 53), A = factor(rep(1:3, c(12, 12, 12))))
# 做正態性檢驗
shapiro.test(rat$X[rat$A == 1])

## 
## 	Shapiro-Wilk normality test
## 
## data:  rat$X[rat$A == 1] 
## W = 0.9731, p-value = 0.9407

shapiro.test(rat$X[rat$A == 2])

## 
## 	Shapiro-Wilk normality test
## 
## data:  rat$X[rat$A == 2] 
## W = 0.9708, p-value = 0.9193

shapiro.test(rat$X[rat$A == 3])

## 
## 	Shapiro-Wilk normality test
## 
## data:  rat$X[rat$A == 3] 
## W = 0.9371, p-value = 0.4613

# 得到三組的p值均大於0.05，可認為數據在三個水平下均是正態分布

# 方差齊性檢驗，是檢驗數據在不同水平下方差是否相同
bartlett.test(X ~ A, data = rat)  #bartlett.test(rat$x,rat$A) 效果相同

## 
## 	Bartlett test of homogeneity of variances
## 
## data:  X by A 
## Bartlett's K-squared = 12.14, df = 2, p-value = 0.002312

# p-value = 0.002312<0.05，因此可認為各組數據方差是不等的。

7.4 以小白鼠為對象研究正常肝核糖核酸（RNA）對癌細胞的生物作用，試驗分別為對照組（生理鹽水），水層RNA組和酚層RNA組，分別用此三種不同處理誘導肝癌細胞的果糖二磷酸酯酶（FDP酶）活力，數據如表7.28所示，問三種不同處理的誘導作用是否相同？

表7.28 三種不同處理的誘導結果

處理方法	誘導結果
對照組	2.79 2.69 3.11 3.47 1.77 2.44 2.83 2.52
水層RNA	3.83 3.15 4.70 3.97 2.03 2.87 3.65 5.09
酚層RNA	5.41 3.47 4.92 4.07 2.18 3.13 3.77 4.26

rat <- data.frame(X = c(2.79, 2.69, 3.11, 3.47, 1.77, 2.44, 2.83, 2.52, 3.83, 
    3.15, 4.7, 3.97, 2.03, 2.87, 3.65, 5.09, 5.41, 3.47, 4.92, 4.07, 2.18, 3.13, 
    3.77, 4.26), A = factor(rep(1:3, c(8, 8, 8))))
fit.aov <- aov(X ~ A, data = rat)
summary(fit.aov)

##             Df Sum Sq Mean Sq F value Pr(>F)  
## A            2   6.44    3.22    4.28  0.028 *
## Residuals   21  15.78    0.75                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

# 可認為三組的作用不相同
plot(rat$X ~ rat$A)

# 從圖中可以可以看出，第一組顯著低於第二和第三組

7.5 為研究人們在催眠狀態下對各種情緒的反應十分有差異，選取了8個受試者，在催眠狀態下，要求每人按任意次序作出恐懼、愉快、憂慮和平靜4中反映。表7.29給出了各受試者在處於這4中清醒狀態下皮膚的電位變化值，試在\(\alpha=0.05\)下，檢驗受試者在催眠狀態下對這4種情緒的反應力是否有顯著差異。

表7.29：4種情緒狀態下皮膚的電位變化值（單位： \(mV\)）

情緒狀態	受試者
	1 2 3 4 5 6 7 8
恐懼	23.1 57.6 10.5 23.6 11.9 54.6 21.0 20.3
愉快	22.7 53.2 9.7 19.6 13.8 47.1 13.6 23.6
憂慮	22.5 53.7 10.8 21.1 13.7 39.2 13.7 16.3
平靜	22.6 53.1 8.3 21.6 13.3 37.0 14.8 14.8

X = c(23.1, 57.6, 10.5, 23.6, 11.9, 54.6, 21, 20.3, 22.7, 53.2, 9.7, 19.6, 13.8, 
    47.1, 13.6, 23.6, 22.5, 53.7, 10.8, 21.1, 13.7, 39.2, 13.7, 16.3, 22.6, 
    53.1, 8.3, 21.6, 13.3, 37, 14.8, 14.8)
g <- gl(4, 8)  #分為三組，每組8個
b <- gl(8, 1, 32)  #每組內又有8個人，有順序
friedman.test(X, g, b)

## 
## 	Friedman rank sum test
## 
## data:  X, g and b 
## Friedman chi-squared = 6.45, df = 3, p-value = 0.09166

# p-value = 0.09166>0.05，接受原假設，可認為四種情緒的反應力無顯著差異

7.6 為了提高化工廠的產品質量，需要尋求最優反應溫度與反應壓力的配合，為此選擇如下水平：

A：反應溫度（\(^0C\)） 60 70 80

B：反應壓力（公斤） 2 2.5 3

在每個\(A_iB_j\)條件下做兩次試驗，其產量如表7.30所示

（1）對數據作方差分析（應考慮交互作用）

（2）求最優條件下平均產量的點估計和區間估計

（3）對\(A_iB_j\)條件下平均產量作多重比較。

表7.30 試驗數據

	\(A_1\)	\(A_2\)	\(A_3\)
\(B_1\)	4.6 4.3	6.1 6.5	6.8 6.4
\(B_2\)	6.3 6.7	3.4 3.8	4.0 3.8
\(B_3\)	4.7 4.3	3.9 3.5	6.5 7.0

product <- data.frame(X = c(4.6, 4.3, 6.1, 6.5, 6.8, 6.4, 6.3, 6.7, 3.4, 3.8, 
    4, 3.8, 4.7, 4.3, 3.9, 3.5, 6.5, 7), A = gl(3, 2, 18), B = gl(3, 6, 18))
# 首先應該對數據做不同水平下的正態性檢驗，和各水平的方差齊性檢驗
# 對數據作方差分析（應考慮交互作用）
product.aov <- aov(X ~ A + B + A:B, data = product)
summary(product.aov)

##             Df Sum Sq Mean Sq F value  Pr(>F)    
## A            2   4.44    2.22    29.8 0.00011 ***
## B            2   3.97    1.99    26.7 0.00016 ***
## A:B          4  21.16    5.29    71.1 8.3e-07 ***
## Residuals    9   0.67    0.07                    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

# 可以看出，因素A和B，及其交互因素對產品質量有顯著影響

# 求最優條件下平均產量的點估計和區間估計 計算兩個因素在不同條件下的均值
tapply(product$X, product$A, mean)

##     1     2     3 
## 5.150 4.533 5.750

tapply(product$X, product$B, mean)

##     1     2     3 
## 5.783 4.667 4.983

# 可以看到在A3和B1條件，為最優條件

product.best <- c(6.8, 6.4)
# 均值的點估計為
mean(product.best)

## [1] 6.6

# 均值的區間估計為
t.test(product.best, alternative = c("two.sided"))

## 
## 	One Sample t-test
## 
## data:  product.best 
## t = 33, df = 1, p-value = 0.01929
## alternative hypothesis: true mean is not equal to 0 
## 95 percent confidence interval:
##  4.059 9.141 
## sample estimates:
## mean of x 
##       6.6


# 對$A_iB_j$條件下平均產量作多重比較
TukeyHSD(product.aov)

##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = X ~ A + B + A:B, data = product)
## 
## $A
##        diff     lwr     upr  p adj
## 2-1 -0.6167 -1.0565 -0.1768 0.0089
## 3-1  0.6000  0.1602  1.0398 0.0104
## 3-2  1.2167  0.7768  1.6565 0.0001
## 
## $B
##        diff     lwr     upr  p adj
## 2-1 -1.1167 -1.5565 -0.6768 0.0002
## 3-1 -0.8000 -1.2398 -0.3602 0.0017
## 3-2  0.3167 -0.1232  0.7565 0.1653
## 
## $`A:B`
##          diff     lwr     upr  p adj
## 2:1-1:1  1.85  0.7706  2.9294 0.0015
## 3:1-1:1  2.15  1.0706  3.2294 0.0005
## 1:2-1:1  2.05  0.9706  3.1294 0.0007
## 2:2-1:1 -0.85 -1.9294  0.2294 0.1557
## 3:2-1:1 -0.55 -1.6294  0.5294 0.5677
## 1:3-1:1  0.05 -1.0294  1.1294 1.0000
## 2:3-1:1 -0.75 -1.8294  0.3294 0.2502
## 3:3-1:1  2.30  1.2206  3.3794 0.0003
## 3:1-2:1  0.30 -0.7794  1.3794 0.9600
## 1:2-2:1  0.20 -0.8794  1.2794 0.9965
## 2:2-2:1 -2.70 -3.7794 -1.6206 0.0001
## 3:2-2:1 -2.40 -3.4794 -1.3206 0.0002
## 1:3-2:1 -1.80 -2.8794 -0.7206 0.0019
## 2:3-2:1 -2.60 -3.6794 -1.5206 0.0001
## 3:3-2:1  0.45 -0.6294  1.5294 0.7612
## 1:2-3:1 -0.10 -1.1794  0.9794 1.0000
## 2:2-3:1 -3.00 -4.0794 -1.9206 0.0000
## 3:2-3:1 -2.70 -3.7794 -1.6206 0.0001
## 1:3-3:1 -2.10 -3.1794 -1.0206 0.0006
## 2:3-3:1 -2.90 -3.9794 -1.8206 0.0000
## 3:3-3:1  0.15 -0.9294  1.2294 0.9995
## 2:2-1:2 -2.90 -3.9794 -1.8206 0.0000
## 3:2-1:2 -2.60 -3.6794 -1.5206 0.0001
## 1:3-1:2 -2.00 -3.0794 -0.9206 0.0008
## 2:3-1:2 -2.80 -3.8794 -1.7206 0.0001
## 3:3-1:2  0.25 -0.8294  1.3294 0.9857
## 3:2-2:2  0.30 -0.7794  1.3794 0.9600
## 1:3-2:2  0.90 -0.1794  1.9794 0.1219
## 2:3-2:2  0.10 -0.9794  1.1794 1.0000
## 3:3-2:2  3.15  2.0706  4.2294 0.0000
## 1:3-3:2  0.60 -0.4794  1.6794 0.4737
## 2:3-3:2 -0.20 -1.2794  0.8794 0.9965
## 3:3-3:2  2.85  1.7706  3.9294 0.0001
## 2:3-1:3 -0.80 -1.8794  0.2794 0.1980
## 3:3-1:3  2.25  1.1706  3.3294 0.0003
## 3:3-2:3  3.05  1.9706  4.1294 0.0000

# 3-2 0.3167 -0.1232 0.7565 0.1653 表示因素B的3和2差異不顯著 A:B
# 的比較類似，p值大於0.05的均可以認為扎伊不顯著

7.7 某良種繁殖場為了提高水稻產量，指定試驗的因素如表7.31所示。試選擇\(L_9(3^4)\)正交表安排試驗，假定相應的產量為（單位：\(kg/100m^2\)）62.925,57.075,51.6,55.05,58.05,56.55,63.225,50.7, 54.45。試對試驗結果進行方差分析，並給出一組較好的種植條件

表7.31 水稻的試驗因素水平表

因素		水平
	1	2	3
品種	窄葉青8號	南二矮5號	珍珠矮11號
密度	4.50棵/100\(m^2\)	3.75棵/100\(m^2\)	3.00棵/100\(m^2\)
施肥量	0.75\(kg/100m^2\)	0.375\(kg/100m^2\)	1.125\(kg/100m^2\)

設三個因素為A(品種),B(密度),C(施肥量)，采用\(L_9(3^4)\)正交表安排試驗，將ABC放到前三列，得到試驗結果表

試驗號	A(品種)	B(密度)	C(施肥量)	產量
1	1	1	1	62.925
2	1	2	2	57.075
3	1	3	3	51.6
4	2	1	2	55.05
5	2	2	3	58.05
6	2	3	1	56.55
7	3	1	3	63.225
8	3	2	1	50.7
9	3	3	2	54.45

rice <- data.frame(A = gl(3, 3), B = gl(3, 1, 9), C = factor(c(1, 2, 3, 2, 3, 
    1, 3, 1, 2)), Y = c(62.925, 57.075, 51.6, 55.05, 58.05, 56.55, 63.225, 50.7, 
    54.45))
# 計算三個因素下產量的均值
tapply(rice$Y, rice$A, mean)

##     1     2     3 
## 57.20 56.55 56.12

tapply(rice$Y, rice$B, mean)

##     1     2     3 
## 60.40 55.27 54.20

tapply(rice$Y, rice$C, mean)

##     1     2     3 
## 56.73 55.52 57.62

#
# 可見，A取2，B取1，C取3時，達到最優條件。即最有種植條件為，品種：南二矮5號；密度：4.50棵/100$m^2$；施肥量：1.125$kg/100m^2$
# 做無交互作用方差分析
rice.aov <- aov(Y ~ A + B + C, data = rice)
summary(rice.aov)

##             Df Sum Sq Mean Sq F value Pr(>F)
## A            2    1.8     0.9    0.02   0.98
## B            2   65.9    32.9    0.84   0.54
## C            2    6.7     3.3    0.08   0.92
## Residuals    2   78.8    39.4

# 發現ABC對結果的影響均不顯著

7.8 某單位研究四種因素對釘螺產卵數（Y）的影響，制定試驗的因素如表7.32所示，試選擇\(L_8(2^7)\)正交表安排試驗，假定相應的釘螺產卵數為（單位：個），86,95,91,94,91,96,83,88，試對試驗結果進行方差分析，並給出一組較好的滅螺方案（考慮有交互作用）。

表7.32 釘螺產卵影響試驗因素的水平表

因素		水平
	1	2
溫度(A)	5\(^0C\)	10\(^0C\)
含氧量(B)	0.5	5.0
含水量(C)	10%	30%
pH值(D)	6.0	8.0

設四個因素為溫度(A),含氧量(B),含水量(C)，pH值(D)，采用\(L_8(2^7)\)兩列間交互作用的正交表安排試驗，第1列放A，第2列放B，第3列放A×B，第4列放C，第5列A×C，第6列B×C，第7列D，得到試驗結果表

試驗號	溫度(A)	含氧量(B)	A×B	含水量(C)	A×C	B×C	pH值(D)	釘螺產卵數
1	1	1	1	1	1	1	1	86
2	1	1	1	2	2	2	2	95
3	1	2	2	1	1	2	2	91
4	1	2	2	2	2	1	1	94
5	2	1	2	1	2	1	2	91
6	2	1	2	2	1	2	1	96
7	2	2	1	1	2	2	1	83
8	2	2	1	2	1	1	2	88

insect <- data.frame(A = gl(2, 4), B = gl(2, 2, 8), C = gl(2, 1, 8), D = factor(c(1, 
    2, 2, 1, 2, 1, 1, 2)), Y = c(86, 95, 91, 94, 91, 96, 83, 88))

# 計算四個個因素下釘螺產卵數的均值
tapply(insect$Y, insect$A, mean)

##    1    2 
## 91.5 89.5

tapply(insect$Y, insect$B, mean)

##  1  2 
## 92 89

tapply(insect$Y, insect$C, mean)

##     1     2 
## 87.75 93.25

tapply(insect$Y, insect$D, mean)

##     1     2 
## 89.75 91.25


#
# 溫度(A)取水平2,含氧量(B)取水平2,含水量(C)取水平1，pH值(D)取水平1，此時釘螺產卵數最少

# 做有交互作用方差分析
insect.aov <- aov(Y ~ A + B + A:B + C + A:C + B:C + D, data = insect)
summary(insect.aov)

##             Df Sum Sq Mean Sq
## A            1    8.0     8.0
## B            1   18.0    18.0
## C            1   60.5    60.5
## D            1    4.5     4.5
## A:B          1   50.0    50.0
## A:C          1    0.5     0.5
## B:C          1    4.5     4.5

# 發現ABCD及其交互作用，對結果的影響均不顯著,去掉Sum
# Sq最大的三個因素B，C,A:B

insect.aov <- aov(Y ~ A + A:C + B:C + D, data = insect)
summary(insect.aov)

##             Df Sum Sq Mean Sq F value Pr(>F)
## A            1    8.0     8.0    0.16   0.76
## D            1    4.5     4.5    0.09   0.81
## A:C          2   61.0    30.5    0.61   0.67
## C:B          2   22.5    11.3    0.23   0.83
## Residuals    1   50.0    50.0

# 可看出各因素及其交互因素對釘螺產卵數無顯著影響

7.9 某工廠為了提高零件內孔研磨工序質量進行工藝的參數優選試驗，考察孔的錐度值，希望其越小越好，在試驗中考察因子的水平表7.33，試選擇\(L_8(2^7)\)正交表安排試驗，其表頭設計如表7.34所示，在每一條件下加工了四個零件，測量其錐度，試驗結果如表7.35所示，試對試驗結果進行方差分析，並給出一組較好的工藝參數指標。

表7.33 因子水平表

因素	水平
	1	2
研孔工藝設備（A）	通用夾具	專用夾具
生鐵研圈材質（B）	特殊鑄鐵	一般灰鑄鐵
留研量（mm）（C）	0.01	0.015

表7.34 試驗結果


表頭設計	A	B	---	C	---	---	---
列號	1	2	3	4	5	6	7

表7.35 試驗結果

試驗號	試驗值
1	1.5 1.7 1.3 1.5
2	1.0 1.2 1.0 1.0
3	2.5 2.2 3.2 2.0
4	2.5 2.5 1.5 2.8
5	1.5 1.8 1.7 1.5
6	1.0 2.5 1.3 1.5
7	1.8 1.5 1.8 2.2
8	1.9 2.6 2.3 2.0

選擇\(L_8(2^7)\)正交表安排試驗，ABC分別放到124列

試驗號	A	B	C	試驗值
1	1	1	1	1.5 1.7 1.3 1.5
2	1	1	2	1.0 1.2 1.0 1.0
3	1	2	1	2.5 2.2 3.2 2.0
4	1	2	2	2.5 2.5 1.5 2.8
5	2	1	1	1.5 1.8 1.7 1.5
6	2	1	2	1.0 2.5 1.3 1.5
7	2	2	1	1.8 1.5 1.8 2.2
8	2	2	2	1.9 2.6 2.3 2.0

# 有重復試驗的方差分析
hole <- data.frame(A = gl(2, 4, 32), B = gl(2, 2, 32), C = gl(2, 1, 32), Y = c(1.5, 
    1, 2.5, 2.5, 1.5, 1, 1.8, 1.9, 1.7, 1.2, 2.2, 2.5, 1.8, 2.5, 1.5, 2.6, 1.3, 
    1, 3.2, 1.5, 1.7, 1.3, 1.8, 2.3, 1.5, 1, 2, 2.8, 1.5, 1.5, 2.2, 2))
hole.aov <- aov(Y ~ A + B + C, data = hole)
summary(hole.aov)

##             Df Sum Sq Mean Sq F value  Pr(>F)    
## A            1   0.01    0.01    0.04    0.84    
## B            1   4.73    4.73   24.06 3.6e-05 ***
## C            1   0.04    0.04    0.19    0.66    
## Residuals   28   5.50    0.20                    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

# 可以看出因素B對實驗結果影響顯著 計算三個因素下釘螺產卵數的均值
tapply(hole$Y, hole$A, mean)

##     1     2 
## 1.837 1.806

tapply(hole$Y, hole$B, mean)

##     1     2 
## 1.438 2.206

tapply(hole$Y, hole$C, mean)

##     1     2 
## 1.856 1.788


# 因此最優的工藝參數指標為A1，B2，C1

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 『原創』統計建模與R軟件-第五章假設檢驗實驗的方差分析（R語言）【數據分析 R語言實戰】學習筆記第八章方差分析與R實現數理統計（一）——用Python進行方差分析方差分析多因素方差分析協方差分析 | ANCOVA (Analysis of Covariance) | R代碼醫學統計學第七章卡方檢驗第七章-查找第七章：矩陣

試驗號	溫度(A)	含氧量(B)	A×B	含水量(C)	A×C	B×C	pH值(D)	釘螺產卵數
1	1	1	1	1	1	1	1	86
2	1	1	1	2	2	2	2	95
3	1	2	2	1	1	2	2	91
4	1	2	2	2	2	1	1	94
5	2	1	2	1	2	1	2	91
6	2	1	2	2	1	2	1	96
7	2	2	1	1	2	2	1	83
8	2	2	1	2	1	1	2	88

試驗號	溫度(A)	含氧量(B)	A×B	含水量(C)	A×C	B×C	pH值(D)	釘螺產卵數
1	1	1	1	1	1	1	1	86
2	1	1	1	2	2	2	2	95
3	1	2	2	1	1	2	2	91
4	1	2	2	2	2	1	1	94
5	2	1	2	1	2	1	2	91
6	2	1	2	2	1	2	1	96
7	2	2	1	1	2	2	1	83
8	2	2	1	2	1	1	2	88

『原創』統計建模與R軟件-第七章 方差分析

統計建模與R軟件-第七章 方差分析