摘要: 本文由digging4發表於:http://www.cnblogs.com/digging4/p/5091536.html
統計建模與R軟件-第七章 方差分析
7.1 三個工廠生產同一種零件,現從各廠產品中分別抽取4件產品作檢測,其檢測強度如表7.25所示。
表7.25 產品檢測數據
工廠 |
零件強度 |
甲 |
115 116 98 83 |
乙 |
103 107 118 116 |
丙 |
73 89 85 97 |
(1)對數據作方差分析,判斷三個廠的產品的零件強度是否有顯著差異
(2)求每個工廠生產產品零件強度的均值,作出相應的區間估計(\(\alpha=0.05\))
(3)對數據作多重檢驗。
df <- data.frame(X = c(115, 116, 98, 83, 103, 107, 118, 116, 73, 89, 85, 97),
A = gl(3, 4))
fit.aov <- aov(X ~ A, data = df)
summary(fit.aov)
## Df Sum Sq Mean Sq F value Pr(>F)
## A 2 1304 652 4.92 0.036 *
## Residuals 9 1192 132
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# 由於P值為0.036,小於0.05,因此認為因素A(三個廠)對零件強度有顯著差異。
plot(df$X ~ df$A)

# 從箱線圖也可以看出三個工廠的零件強度有顯著差異。
# 對三個廠的零件強度求均值及其區間估計
mean.1 <- mean(df$X[df$A == 1])
mean.1.t <- t.test(df$X[df$A == 1], conf.level = 0.95)
mean.2 <- mean(df$X[df$A == 2])
mean.2.t <- t.test(df$X[df$A == 2], conf.level = 0.95)
mean.3 <- mean(df$X[df$A == 3])
mean.3.t <- t.test(df$X[df$A == 3], conf.level = 0.95)
reulst <- data.frame(A = c(1, 2, 3), mean = c(mean.1, mean.2, mean.3), t.test.down = c(mean.1.t[4]$conf.int[1],
mean.2.t[4]$conf.int[1], mean.3.t[4]$conf.int[1]), t.test.up = c(mean.1.t[4]$conf.int[2],
mean.2.t[4]$conf.int[2], mean.3.t[4]$conf.int[2]))
reulst
## A mean t.test.down t.test.up
## 1 1 103 78.04 128.0
## 2 2 111 99.60 122.4
## 3 3 86 70.09 101.9
# 對數據做多重檢驗
pairwise.t.test(df$X, df$A, p.adjust.method = "none")
##
## Pairwise comparisons using t tests with pooled SD
##
## data: df$X and df$A
##
## 1 2
## 2 0.351 -
## 3 0.066 0.013
##
## P value adjustment method: none
# 可以看到1和2的p值為0.351,可認為兩水平無差異。
# 1和3的P值0.066有差異,不顯著;2和3的P值0.013,差異顯著。
# 結論為工廠丙的零件強度與其他兩個廠有顯著差異,甲乙兩廠無差異。
7.2有四種產品,\(A_i,i=1,2,3\)分別為國內甲、乙、丙三個工廠生產的產品,\(A_4\)國外同類產品,現從各廠分別取10,6,6和2個產品做300小時連續磨損老化試驗,得變化率如表7.26所示,假定各廠產品試驗變化率服從等方差的正態分布。
表7.26 磨損老化試驗數據
產品 |
變化率 |
\(A_1\) |
20 18 19 17 15 16 13 18 22 17 |
\(A_2\) |
26 19 26 28 23 25 |
\(A_3\) |
24 25 18 22 27 24 |
\(A_4\) |
12 14 |
(1)試問四個廠生產的產品的變化率是否有顯著差異?
(2)若有差異,請做進一步的檢驗。i)國內產品與國外產品有無顯著差異?ii)國內各廠家的產品有無顯著差異?
df <- data.frame(X = c(20, 18, 19, 17, 15, 16, 13, 18, 22, 17, 26, 19, 26, 28,
23, 25, 24, 25, 18, 22, 27, 24, 12, 14), A = factor(rep(1:4, c(10, 6, 6,
2))))
fit.aov <- aov(X ~ A, data = df)
summary(fit.aov)
## Df Sum Sq Mean Sq F value Pr(>F)
## A 3 346 115.3 14.7 2.8e-05 ***
## Residuals 20 157 7.9
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# P值為2.8e-05,可認為四個廠生產的產品的變化率有顯著差異
# 國內產品與國外產品有無顯著差異? 將國內產品看做一類,國外產品看做另一類
df2 <- data.frame(X = c(20, 18, 19, 17, 15, 16, 13, 18, 22, 17, 26, 19, 26,
28, 23, 25, 24, 25, 18, 22, 27, 24, 12, 14), A = factor(rep(1:2, c(22, 2))))
fit.aov2 <- aov(X ~ A, data = df2)
summary(fit.aov2)
## Df Sum Sq Mean Sq F value Pr(>F)
## A 1 117 117.3 6.69 0.017 *
## Residuals 22 386 17.5
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# p值為0.017,可認為國內產品與國外產品有顯著差異
# 國內各廠家的產品有無顯著差異?
fit.aov3 <- aov(X ~ A, data = df[df$A != 4, ])
summary(fit.aov3)
## Df Sum Sq Mean Sq F value Pr(>F)
## A 2 229 114.3 14 0.00018 ***
## Residuals 19 155 8.2
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# p值為0.00018,可認為國內各廠家的產品有顯著差異
7.3某單位在大白鼠營養試驗中,隨機將大白鼠分為三組,測得每組12只大白鼠尿中氨氮的排出量\(X(mg/6d)\),數據由表7.27所示,試對該資料做正態性檢驗和方差齊性檢驗。
表7.27 白鼠尿中氨氮檢測數據
白鼠 |
大白鼠營養試驗中各組大鼠尿氨氮排出量\(X(mg/6d)\) |
第一組 |
30 27 35 35 29 33 32 36 26 41 33 31 |
第二組 |
43 45 53 44 51 53 54 37 47 57 48 42 |
第三組 |
82 66 66 86 56 52 76 83 72 73 59 53 |
rat <- data.frame(X = c(30, 27, 35, 35, 29, 33, 32, 36, 26, 41, 33, 31, 43,
45, 53, 44, 51, 53, 54, 37, 47, 57, 48, 42, 82, 66, 66, 86, 56, 52, 76,
83, 72, 73, 59, 53), A = factor(rep(1:3, c(12, 12, 12))))
# 做正態性檢驗
shapiro.test(rat$X[rat$A == 1])
##
## Shapiro-Wilk normality test
##
## data: rat$X[rat$A == 1]
## W = 0.9731, p-value = 0.9407
shapiro.test(rat$X[rat$A == 2])
##
## Shapiro-Wilk normality test
##
## data: rat$X[rat$A == 2]
## W = 0.9708, p-value = 0.9193
shapiro.test(rat$X[rat$A == 3])
##
## Shapiro-Wilk normality test
##
## data: rat$X[rat$A == 3]
## W = 0.9371, p-value = 0.4613
# 得到三組的p值均大於0.05,可認為數據在三個水平下均是正態分布
# 方差齊性檢驗,是檢驗數據在不同水平下方差是否相同
bartlett.test(X ~ A, data = rat) #bartlett.test(rat$x,rat$A) 效果相同
##
## Bartlett test of homogeneity of variances
##
## data: X by A
## Bartlett's K-squared = 12.14, df = 2, p-value = 0.002312
# p-value = 0.002312<0.05,因此可認為各組數據方差是不等的。
7.4 以小白鼠為對象研究正常肝核糖核酸(RNA)對癌細胞的生物作用,試驗分別為對照組(生理鹽水),水層RNA組和酚層RNA組,分別用此三種不同處理誘導肝癌細胞的果糖二磷酸酯酶(FDP酶)活力,數據如表7.28所示,問三種不同處理的誘導作用是否相同?
表7.28 三種不同處理的誘導結果
處理方法 |
誘導結果 |
對照組 |
2.79 2.69 3.11 3.47 1.77 2.44 2.83 2.52 |
水層RNA |
3.83 3.15 4.70 3.97 2.03 2.87 3.65 5.09 |
酚層RNA |
5.41 3.47 4.92 4.07 2.18 3.13 3.77 4.26 |
rat <- data.frame(X = c(2.79, 2.69, 3.11, 3.47, 1.77, 2.44, 2.83, 2.52, 3.83,
3.15, 4.7, 3.97, 2.03, 2.87, 3.65, 5.09, 5.41, 3.47, 4.92, 4.07, 2.18, 3.13,
3.77, 4.26), A = factor(rep(1:3, c(8, 8, 8))))
fit.aov <- aov(X ~ A, data = rat)
summary(fit.aov)
## Df Sum Sq Mean Sq F value Pr(>F)
## A 2 6.44 3.22 4.28 0.028 *
## Residuals 21 15.78 0.75
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# 可認為三組的作用不相同
plot(rat$X ~ rat$A)

# 從圖中可以可以看出,第一組顯著低於第二和第三組
7.5 為研究人們在催眠狀態下對各種情緒的反應十分有差異,選取了8個受試者,在催眠狀態下,要求每人按任意次序作出恐懼、愉快、憂慮和平靜4中反映。表7.29給出了各受試者在處於這4中清醒狀態下皮膚的電位變化值,試在\(\alpha=0.05\)下,檢驗受試者在催眠狀態下對這4種情緒的反應力是否有顯著差異。
表7.29:4種情緒狀態下皮膚的電位變化值(單位: \(mV\))
情緒狀態 |
受試者 |
|
1 2 3 4 5 6 7 8 |
恐懼 |
23.1 57.6 10.5 23.6 11.9 54.6 21.0 20.3 |
愉快 |
22.7 53.2 9.7 19.6 13.8 47.1 13.6 23.6 |
憂慮 |
22.5 53.7 10.8 21.1 13.7 39.2 13.7 16.3 |
平靜 |
22.6 53.1 8.3 21.6 13.3 37.0 14.8 14.8 |
X = c(23.1, 57.6, 10.5, 23.6, 11.9, 54.6, 21, 20.3, 22.7, 53.2, 9.7, 19.6, 13.8,
47.1, 13.6, 23.6, 22.5, 53.7, 10.8, 21.1, 13.7, 39.2, 13.7, 16.3, 22.6,
53.1, 8.3, 21.6, 13.3, 37, 14.8, 14.8)
g <- gl(4, 8) #分為三組,每組8個
b <- gl(8, 1, 32) #每組內又有8個人,有順序
friedman.test(X, g, b)
##
## Friedman rank sum test
##
## data: X, g and b
## Friedman chi-squared = 6.45, df = 3, p-value = 0.09166
# p-value = 0.09166>0.05,接受原假設,可認為四種情緒的反應力無顯著差異
7.6 為了提高化工廠的產品質量,需要尋求最優反應溫度與反應壓力的配合,為此選擇如下水平:
A:反應溫度(\(^0C\)) 60 70 80
B:反應壓力(公斤) 2 2.5 3
在每個\(A_iB_j\)條件下做兩次試驗,其產量如表7.30所示
(1)對數據作方差分析(應考慮交互作用)
(2)求最優條件下平均產量的點估計和區間估計
(3)對\(A_iB_j\)條件下平均產量作多重比較。
表7.30 試驗數據
|
\(A_1\) |
\(A_2\) |
\(A_3\) |
\(B_1\) |
4.6 4.3 |
6.1 6.5 |
6.8 6.4 |
\(B_2\) |
6.3 6.7 |
3.4 3.8 |
4.0 3.8 |
\(B_3\) |
4.7 4.3 |
3.9 3.5 |
6.5 7.0 |
product <- data.frame(X = c(4.6, 4.3, 6.1, 6.5, 6.8, 6.4, 6.3, 6.7, 3.4, 3.8,
4, 3.8, 4.7, 4.3, 3.9, 3.5, 6.5, 7), A = gl(3, 2, 18), B = gl(3, 6, 18))
# 首先應該對數據做不同水平下的正態性檢驗,和各水平的方差齊性檢驗
# 對數據作方差分析(應考慮交互作用)
product.aov <- aov(X ~ A + B + A:B, data = product)
summary(product.aov)
## Df Sum Sq Mean Sq F value Pr(>F)
## A 2 4.44 2.22 29.8 0.00011 ***
## B 2 3.97 1.99 26.7 0.00016 ***
## A:B 4 21.16 5.29 71.1 8.3e-07 ***
## Residuals 9 0.67 0.07
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# 可以看出,因素A和B,及其交互因素對產品質量有顯著影響
# 求最優條件下平均產量的點估計和區間估計 計算兩個因素在不同條件下的均值
tapply(product$X, product$A, mean)
## 1 2 3
## 5.150 4.533 5.750
tapply(product$X, product$B, mean)
## 1 2 3
## 5.783 4.667 4.983
# 可以看到在A3和B1條件,為最優條件
product.best <- c(6.8, 6.4)
# 均值的點估計為
mean(product.best)
## [1] 6.6
# 均值的區間估計為
t.test(product.best, alternative = c("two.sided"))
##
## One Sample t-test
##
## data: product.best
## t = 33, df = 1, p-value = 0.01929
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## 4.059 9.141
## sample estimates:
## mean of x
## 6.6
# 對$A_iB_j$條件下平均產量作多重比較
TukeyHSD(product.aov)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = X ~ A + B + A:B, data = product)
##
## $A
## diff lwr upr p adj
## 2-1 -0.6167 -1.0565 -0.1768 0.0089
## 3-1 0.6000 0.1602 1.0398 0.0104
## 3-2 1.2167 0.7768 1.6565 0.0001
##
## $B
## diff lwr upr p adj
## 2-1 -1.1167 -1.5565 -0.6768 0.0002
## 3-1 -0.8000 -1.2398 -0.3602 0.0017
## 3-2 0.3167 -0.1232 0.7565 0.1653
##
## $`A:B`
## diff lwr upr p adj
## 2:1-1:1 1.85 0.7706 2.9294 0.0015
## 3:1-1:1 2.15 1.0706 3.2294 0.0005
## 1:2-1:1 2.05 0.9706 3.1294 0.0007
## 2:2-1:1 -0.85 -1.9294 0.2294 0.1557
## 3:2-1:1 -0.55 -1.6294 0.5294 0.5677
## 1:3-1:1 0.05 -1.0294 1.1294 1.0000
## 2:3-1:1 -0.75 -1.8294 0.3294 0.2502
## 3:3-1:1 2.30 1.2206 3.3794 0.0003
## 3:1-2:1 0.30 -0.7794 1.3794 0.9600
## 1:2-2:1 0.20 -0.8794 1.2794 0.9965
## 2:2-2:1 -2.70 -3.7794 -1.6206 0.0001
## 3:2-2:1 -2.40 -3.4794 -1.3206 0.0002
## 1:3-2:1 -1.80 -2.8794 -0.7206 0.0019
## 2:3-2:1 -2.60 -3.6794 -1.5206 0.0001
## 3:3-2:1 0.45 -0.6294 1.5294 0.7612
## 1:2-3:1 -0.10 -1.1794 0.9794 1.0000
## 2:2-3:1 -3.00 -4.0794 -1.9206 0.0000
## 3:2-3:1 -2.70 -3.7794 -1.6206 0.0001
## 1:3-3:1 -2.10 -3.1794 -1.0206 0.0006
## 2:3-3:1 -2.90 -3.9794 -1.8206 0.0000
## 3:3-3:1 0.15 -0.9294 1.2294 0.9995
## 2:2-1:2 -2.90 -3.9794 -1.8206 0.0000
## 3:2-1:2 -2.60 -3.6794 -1.5206 0.0001
## 1:3-1:2 -2.00 -3.0794 -0.9206 0.0008
## 2:3-1:2 -2.80 -3.8794 -1.7206 0.0001
## 3:3-1:2 0.25 -0.8294 1.3294 0.9857
## 3:2-2:2 0.30 -0.7794 1.3794 0.9600
## 1:3-2:2 0.90 -0.1794 1.9794 0.1219
## 2:3-2:2 0.10 -0.9794 1.1794 1.0000
## 3:3-2:2 3.15 2.0706 4.2294 0.0000
## 1:3-3:2 0.60 -0.4794 1.6794 0.4737
## 2:3-3:2 -0.20 -1.2794 0.8794 0.9965
## 3:3-3:2 2.85 1.7706 3.9294 0.0001
## 2:3-1:3 -0.80 -1.8794 0.2794 0.1980
## 3:3-1:3 2.25 1.1706 3.3294 0.0003
## 3:3-2:3 3.05 1.9706 4.1294 0.0000
# 3-2 0.3167 -0.1232 0.7565 0.1653 表示因素B的3和2差異不顯著 A:B
# 的比較類似,p值大於0.05的均可以認為扎伊不顯著
7.7 某良種繁殖場為了提高水稻產量,指定試驗的因素如表7.31所示。試選擇\(L_9(3^4)\)正交表安排試驗,假定相應的產量為(單位:\(kg/100m^2\))62.925,57.075,51.6,55.05,58.05,56.55,63.225,50.7, 54.45。試對試驗結果進行方差分析,並給出一組較好的種植條件
表7.31 水稻的試驗因素水平表
因素 |
|
水平 |
|
|
1 |
2 |
3 |
品種 |
窄葉青8號 |
南二矮5號 |
珍珠矮11號 |
密度 |
4.50棵/100\(m^2\) |
3.75棵/100\(m^2\) |
3.00棵/100\(m^2\) |
施肥量 |
0.75\(kg/100m^2\) |
0.375\(kg/100m^2\) |
1.125\(kg/100m^2\) |
設三個因素為A(品種),B(密度),C(施肥量),采用\(L_9(3^4)\)正交表安排試驗,將ABC放到前三列,得到試驗結果表
試驗號 |
A(品種) |
B(密度) |
C(施肥量) |
產量 |
1 |
1 |
1 |
1 |
62.925 |
2 |
1 |
2 |
2 |
57.075 |
3 |
1 |
3 |
3 |
51.6 |
4 |
2 |
1 |
2 |
55.05 |
5 |
2 |
2 |
3 |
58.05 |
6 |
2 |
3 |
1 |
56.55 |
7 |
3 |
1 |
3 |
63.225 |
8 |
3 |
2 |
1 |
50.7 |
9 |
3 |
3 |
2 |
54.45 |
rice <- data.frame(A = gl(3, 3), B = gl(3, 1, 9), C = factor(c(1, 2, 3, 2, 3,
1, 3, 1, 2)), Y = c(62.925, 57.075, 51.6, 55.05, 58.05, 56.55, 63.225, 50.7,
54.45))
# 計算三個因素下產量的均值
tapply(rice$Y, rice$A, mean)
## 1 2 3
## 57.20 56.55 56.12
tapply(rice$Y, rice$B, mean)
## 1 2 3
## 60.40 55.27 54.20
tapply(rice$Y, rice$C, mean)
## 1 2 3
## 56.73 55.52 57.62
#
# 可見,A取2,B取1,C取3時,達到最優條件。即最有種植條件為,品種:南二矮5號;密度:4.50棵/100$m^2$;施肥量:1.125$kg/100m^2$
# 做無交互作用方差分析
rice.aov <- aov(Y ~ A + B + C, data = rice)
summary(rice.aov)
## Df Sum Sq Mean Sq F value Pr(>F)
## A 2 1.8 0.9 0.02 0.98
## B 2 65.9 32.9 0.84 0.54
## C 2 6.7 3.3 0.08 0.92
## Residuals 2 78.8 39.4
# 發現ABC對結果的影響均不顯著
7.8 某單位研究四種因素對釘螺產卵數(Y)的影響,制定試驗的因素如表7.32所示,試選擇\(L_8(2^7)\)正交表安排試驗,假定相應的釘螺產卵數為(單位:個),86,95,91,94,91,96,83,88,試對試驗結果進行方差分析,並給出一組較好的滅螺方案(考慮有交互作用)。
表7.32 釘螺產卵影響試驗因素的水平表
因素 |
|
水平 |
|
1 |
2 |
溫度(A) |
5\(^0C\) |
10\(^0C\) |
含氧量(B) |
0.5 |
5.0 |
含水量(C) |
10% |
30% |
pH值(D) |
6.0 |
8.0 |
設四個因素為溫度(A),含氧量(B),含水量(C),pH值(D),采用\(L_8(2^7)\)兩列間交互作用的正交表安排試驗,第1列放A,第2列放B,第3列放A×B,第4列放C,第5列A×C,第6列B×C,第7列D,得到試驗結果表
試驗號 |
溫度(A) |
含氧量(B) |
A×B |
含水量(C) |
A×C |
B×C |
pH值(D) |
釘螺產卵數 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
86 |
2 |
1 |
1 |
1 |
2 |
2 |
2 |
2 |
95 |
3 |
1 |
2 |
2 |
1 |
1 |
2 |
2 |
91 |
4 |
1 |
2 |
2 |
2 |
2 |
1 |
1 |
94 |
5 |
2 |
1 |
2 |
1 |
2 |
1 |
2 |
91 |
6 |
2 |
1 |
2 |
2 |
1 |
2 |
1 |
96 |
7 |
2 |
2 |
1 |
1 |
2 |
2 |
1 |
83 |
8 |
2 |
2 |
1 |
2 |
1 |
1 |
2 |
88 |
insect <- data.frame(A = gl(2, 4), B = gl(2, 2, 8), C = gl(2, 1, 8), D = factor(c(1,
2, 2, 1, 2, 1, 1, 2)), Y = c(86, 95, 91, 94, 91, 96, 83, 88))
# 計算四個個因素下釘螺產卵數的均值
tapply(insect$Y, insect$A, mean)
## 1 2
## 91.5 89.5
tapply(insect$Y, insect$B, mean)
## 1 2
## 92 89
tapply(insect$Y, insect$C, mean)
## 1 2
## 87.75 93.25
tapply(insect$Y, insect$D, mean)
## 1 2
## 89.75 91.25
#
# 溫度(A)取水平2,含氧量(B)取水平2,含水量(C)取水平1,pH值(D)取水平1,此時釘螺產卵數最少
# 做有交互作用方差分析
insect.aov <- aov(Y ~ A + B + A:B + C + A:C + B:C + D, data = insect)
summary(insect.aov)
## Df Sum Sq Mean Sq
## A 1 8.0 8.0
## B 1 18.0 18.0
## C 1 60.5 60.5
## D 1 4.5 4.5
## A:B 1 50.0 50.0
## A:C 1 0.5 0.5
## B:C 1 4.5 4.5
# 發現ABCD及其交互作用,對結果的影響均不顯著,去掉Sum
# Sq最大的三個因素B,C,A:B
insect.aov <- aov(Y ~ A + A:C + B:C + D, data = insect)
summary(insect.aov)
## Df Sum Sq Mean Sq F value Pr(>F)
## A 1 8.0 8.0 0.16 0.76
## D 1 4.5 4.5 0.09 0.81
## A:C 2 61.0 30.5 0.61 0.67
## C:B 2 22.5 11.3 0.23 0.83
## Residuals 1 50.0 50.0
# 可看出各因素及其交互因素對釘螺產卵數無顯著影響
7.9 某工廠為了提高零件內孔研磨工序質量進行工藝的參數優選試驗,考察孔的錐度值,希望其越小越好,在試驗中考察因子的水平表7.33,試選擇\(L_8(2^7)\)正交表安排試驗,其表頭設計如表7.34所示,在每一條件下加工了四個零件,測量其錐度,試驗結果如表7.35所示,試對試驗結果進行方差分析,並給出一組較好的工藝參數指標。
表7.33 因子水平表
因素 |
水平 |
|
|
1 |
2 |
研孔工藝設備(A) |
通用夾具 |
專用夾具 |
生鐵研圈材質(B) |
特殊鑄鐵 |
一般灰鑄鐵 |
留研量(mm)(C) |
0.01 |
0.015 |
表7.34 試驗結果
|
|
|
|
|
|
|
|
表頭設計 |
A |
B |
--- |
C |
--- |
--- |
--- |
列號 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
表7.35 試驗結果
試驗號 |
試驗值 |
1 |
1.5 1.7 1.3 1.5 |
2 |
1.0 1.2 1.0 1.0 |
3 |
2.5 2.2 3.2 2.0 |
4 |
2.5 2.5 1.5 2.8 |
5 |
1.5 1.8 1.7 1.5 |
6 |
1.0 2.5 1.3 1.5 |
7 |
1.8 1.5 1.8 2.2 |
8 |
1.9 2.6 2.3 2.0 |
選擇\(L_8(2^7)\)正交表安排試驗,ABC分別放到124列
試驗號 |
A |
B |
C |
試驗值 |
1 |
1 |
1 |
1 |
1.5 1.7 1.3 1.5 |
2 |
1 |
1 |
2 |
1.0 1.2 1.0 1.0 |
3 |
1 |
2 |
1 |
2.5 2.2 3.2 2.0 |
4 |
1 |
2 |
2 |
2.5 2.5 1.5 2.8 |
5 |
2 |
1 |
1 |
1.5 1.8 1.7 1.5 |
6 |
2 |
1 |
2 |
1.0 2.5 1.3 1.5 |
7 |
2 |
2 |
1 |
1.8 1.5 1.8 2.2 |
8 |
2 |
2 |
2 |
1.9 2.6 2.3 2.0 |
# 有重復試驗的方差分析
hole <- data.frame(A = gl(2, 4, 32), B = gl(2, 2, 32), C = gl(2, 1, 32), Y = c(1.5,
1, 2.5, 2.5, 1.5, 1, 1.8, 1.9, 1.7, 1.2, 2.2, 2.5, 1.8, 2.5, 1.5, 2.6, 1.3,
1, 3.2, 1.5, 1.7, 1.3, 1.8, 2.3, 1.5, 1, 2, 2.8, 1.5, 1.5, 2.2, 2))
hole.aov <- aov(Y ~ A + B + C, data = hole)
summary(hole.aov)
## Df Sum Sq Mean Sq F value Pr(>F)
## A 1 0.01 0.01 0.04 0.84
## B 1 4.73 4.73 24.06 3.6e-05 ***
## C 1 0.04 0.04 0.19 0.66
## Residuals 28 5.50 0.20
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# 可以看出因素B對實驗結果影響顯著 計算三個因素下釘螺產卵數的均值
tapply(hole$Y, hole$A, mean)
## 1 2
## 1.837 1.806
tapply(hole$Y, hole$B, mean)
## 1 2
## 1.438 2.206
tapply(hole$Y, hole$C, mean)
## 1 2
## 1.856 1.788
# 因此最優的工藝參數指標為A1,B2,C1