單樣本t檢驗
目的:利用來自總體的樣本數據,推斷該總體的均值是否與指定的檢驗值存在差異。
適用條件:樣本來自的總體應服從或者近似服從正態分布。
注:當樣本量n比較大時:由中心極限定理得知,即使原數據不服從正態分布,但是樣本量足夠大,他的樣本均數抽樣分布仍然是正態的,因此,在樣本量很大的情況下很少考慮單樣本t檢驗的適用條件;
當樣本量n比較小時,總體應服從正態分布;
總結:只要數據沒有很強烈的偏態,單樣本t檢驗的分析結果都是穩定的。
案例分析:
案例描述:推斷信用卡刷卡金額的平均值是否不低於3000元。(數據來源:《統計分析與SPSS的應用》薛薇 第五章)
題目分析:該問題涉及的是單個總體(信用卡刷卡金額),進行總體均值檢驗,同時總體可近似認為服從正態分布(正態分布檢驗),因此用單樣本t檢驗。
案例步驟:
提出原假設:信用卡刷卡金額的平均值不顯著低於3000元。
界面菜單操作:分析—比較均值—單樣本T檢驗—選擇檢驗的變量—得出結果
關鍵步驟截圖:
檢驗值應填3000
缺失值的處理:
(1)按分析順序排除個案:只針對計算變量的缺失值,剔除該變量的個案;
(2)按列表排除個案:針對列表中所有變量的缺失值,一旦發現某個變量有缺失值,直接剔除該個案。
結果分析:
單個樣本統計量 |
||||
|
N |
均值 |
標准差 |
均值的標准誤 |
月平均刷卡金額 |
500 |
4781.8786 |
7418.71785 |
331.77515 |
均值的標准誤:
單個樣本檢驗 |
||||||
|
檢驗值 = 3000 |
|||||
t |
df |
Sig.(雙側) |
均值差值 |
差分的 95% 置信區間 |
||
下限 |
上限 |
|||||
月平均刷卡金額 |
5.371 |
499 |
.000 |
1781.87860 |
1130.0302 |
2433.7270 |
t統計量的數學定義:
df:自由度(n-1)
Sig(雙側):雙側概率P-值;
注:
(1)當問題使用的是雙側檢驗方法時,比較ɑ(一般取0.05)和p;當p<ɑ時,拒絕原假設,接受備假設。當p>=ɑ,則相反。
(2)當問題使用的是單側檢驗方法時,比較ɑ(一般取0.05)和p/2;當p/2<ɑ時,拒絕原假設,接受備假設。當p/2>=ɑ,則相反。
(3)什么時候使用單側檢驗?雙側檢驗?看問題本身。舉例:單側檢驗如本題,只能從一個方向拒絕原假設:信用卡刷卡金額的平均值低於3000元;雙側檢驗如:有一個原假設:實際住房面積的平均值與20平方米無顯著差異,這時候可以從兩個方向拒絕原假設:實際住房面積的平均值遠大於或者遠小於20平方米。
在本題中:p/2<0.05,因此,拒絕原假設,接受備假設,認為該地區的信用卡刷卡金額的平均值與3000元有明顯差異,而且遠遠高於3000元。
置信區間:95%的置信區間為(1130.0302,2433.7270),我們有95%的把握認為月刷卡金額的平均值在4130.0302~5433.7270之間。
參考書籍:
《統計分析與SPSS的應用》(第五版)薛薇
《SPSS統計分析從零開始》吳駿
《SPSS統計分析基礎教程》張文彤