假設檢驗是先對總體參數進行提出某種假設的前提下,利用樣本信息判斷假設是否成立。
假設檢驗中基本概念
原假設和備擇假設
原假設,用H0表示。原假設一般是統計者想要拒絕的假設。
備擇假設,用H1表示。備則假設是統計者想要接受的假設。
為什么統計者想要拒絕的假設設置為原假設呢?這是由於若原假設被拒絕如果出錯的話,只能犯第I類(棄真)錯誤,而犯第I類錯誤的概率已經被規定的顯著性水平𝞪所控制。
假設檢驗的兩類錯誤
第Ⅰ類錯誤(棄真錯誤):當原假設為真時拒絕原假設。犯第Ⅰ類錯誤的概率通常記為α(顯著性水平)。
第Ⅱ類錯誤(納偽錯誤):當原假設為假時接受原假設。犯第Ⅱ類錯誤的概率通常記為β。
接受H0 | 拒絕H0 | |
H0為真 | 正確決策 | 第Ⅰ類錯誤 |
H0為假 | 第Ⅱ類錯誤 | 正確決策 |
發生第Ⅰ類錯誤的概率:如果發生棄真錯誤,那么一定是拒絕了原假設(樣本結果位於拒絕域內),拒絕域由檢驗水平決定,如果顯著性水平為α,則發生棄真錯誤的概率為α。
檢驗統計量:根據實際情況,用於假設檢驗計算的統計量,在H0條件下,統計量服從特定的概率分布。
拒絕域:若樣本觀測結果位於拒絕域內,則具有充分理由拒絕H0。若樣本觀測結果位於拒絕域內,則不拒絕H0。拒絕域取值由顯著性水平和統計量分布決定。
顯著性水平:規定的小概率α,由於小概率事件在一次試驗中很難發生,所以若小概率事件發生了,即p值小於α、樣本觀測值位於拒絕域內,則具有充分理由拒絕H0。
p值:樣本觀測值在拒絕域方向的概率,利用樣本進行計算,判定p值是否小於顯著性水平即樣本結果是否在拒絕域內。
檢驗形式
(1)單側檢驗
通過備擇假設確定左右側,若備擇假設為<,則使用左側,若備擇假設為>,則使用右側。
(2)雙側檢驗
拒絕域一分為二位於數據集的兩側,選擇顯著性水平,將拒絕域一分為二,兩側概率各占α/2。
若備擇假設包含不等號≠,需要使用雙側檢驗。
假設檢驗步驟
- 確定要進行檢驗的假設H0 H1
- 選擇檢驗統計量
- 通過顯著性水平確定拒絕域
- 求出檢驗統計量p值
- 查看樣本結果是否位於拒絕域內
- 作出決策
例題:






