單樣本t檢驗用於檢驗一個樣本均值與假設的總體均值的差異是否顯著。
對於一個總體來說,其集中趨勢或者說中心值是我們關心的,因此需要了解總體的均值,但是由於總體的不可知性,我們首先對總體均值的取值進行假設,然后對總體進行抽樣,通過樣本均值的情況來檢驗我們對總體均值的假設是否成立,根據假設檢驗的小概率原則,如果在我們假設的總體均值下,樣本均值觀測值出現的概率是小概率,那么說明總體均值的假設是錯誤的,反之,則說明總體均值的假設是可以接受的。
Case:
某種元件的壽命x(小時),服從正態分布,N(mu,sigma^2),其中mu,sigma^2均未知,其中抽樣的16只元件的壽命如下:
159 |
280 |
101 |
212 |
224 |
379 |
179 |
264 |
222 |
362 |
168 |
250 |
149 |
260 |
485 |
170 |
問是否有理由認為元件的平均壽命等於250小時?
操作說明:
【Excel】
公式說明:
結果解讀:在總體均值的假設值中輸入250即可在p值中出現上側、下側、雙側的p值。因為雙側檢驗p值為0.735>0.05,所以不能拒絕原假設(),拒絕備擇假設(
),因此認為在0.05的顯著性水平下,測量元件壽命與250沒有顯著性差異,也就是以95%的概率接受元件壽命等於250的結論。
【SPSS】
步驟1:點擊"分析(A)",選擇"比較均值(M)",點擊"單樣本T檢驗(S)",如圖所示
步驟2:將"元件壽命"放到"檢驗變量(T)"中,我們在這里將"檢驗值"設為"250",如圖所示
步驟3:點擊"選項(O)",我們會發現"置信區間百分比(C)"的默認值為"0.95",我們這里選擇默認值
結果解讀:通過結果我們可以看出:"單個樣本統計量"包括檢驗的樣本均值(241.5),樣本的標准差(98.726)、樣本均值的標准差也就是樣本的標准誤差(24.681)以及t統計量(-0.344)等.其中均值差值為樣本均值241.5和檢驗值250的差(-8.5),總體均值的95%的置信區間為(250-61.11,250+44.11),而241.5在95%的置信區間中.本例的雙側Sig值為0.735>0.05,所以不能拒絕原假設(),拒絕備擇假設(
),因此認為在0.05的顯著性水平下,測量元件壽命與250沒有顯著性差異,也就是以95%的概率接受元件壽命等於250的結論。
【R】
x<-c(159, 280, 101, 212, 224, 379, 179, 264, 222, 362, 168, 250, 149, 260, 485, 170)
t.test(x, alternative ="two.sided", mu = 250)
結果解讀:
One Sample t-test
#單樣本t檢驗
data: x
#使用數據為x
t = -0.34439, df = 15, p-value = 0.7353
#t檢驗值為-0.34439,自由度為16-1=15,p值為0.735>0.05,所以不能拒絕原假設
alternative hypothesis: true mean is not equal to 250
#備擇假設為總體均值不等於250
95 percent confidence interval:
188.8927 294.1073
#95%的置信區間為(188.8927,294.1073)
sample estimates:
mean of x
241.5