假設檢驗


假設檢驗是先對總體參數進行提出某種假設的前提下,利用樣本信息判斷假設是否成立。

 

假設檢驗中基本概念

原假設和備擇假設

原假設,用H0表示。原假設一般是統計者想要拒絕的假設。

備擇假設,用H1表示。備則假設是統計者想要接受的假設。

為什么統計者想要拒絕的假設設置為原假設呢?這是由於若原假設被拒絕如果出錯的話,只能犯第I類(棄真)錯誤,而犯第I類錯誤的概率已經被規定的顯著性水平𝞪所控制。

 

假設檢驗的兩類錯誤

第Ⅰ類錯誤(棄真錯誤):當原假設為真時拒絕原假設。犯第Ⅰ類錯誤的概率通常記為α(顯著性水平)。

第Ⅱ類錯誤(納偽錯誤):當原假設為假時接受原假設。犯第Ⅱ類錯誤的概率通常記為β。

  接受H0 拒絕H0
H0為真 正確決策 第Ⅰ類錯誤
H0為假 第Ⅱ類錯誤 正確決策

發生第Ⅰ類錯誤的概率:如果發生棄真錯誤,那么一定是拒絕了原假設(樣本結果位於拒絕域內),拒絕域由檢驗水平決定,如果顯著性水平為α,則發生棄真錯誤的概率為α

 

檢驗統計量:根據實際情況,用於假設檢驗計算的統計量,在H0條件下,統計量服從特定的概率分布。

 

拒絕域:若樣本觀測結果位於拒絕域內,則具有充分理由拒絕H0。若樣本觀測結果位於拒絕域內,則不拒絕H0。拒絕域取值由顯著性水平和統計量分布決定。

 

顯著性水平:規定的小概率α,由於小概率事件在一次試驗中很難發生,所以若小概率事件發生了,即p值小於α、樣本觀測值位於拒絕域內,則具有充分理由拒絕H0。

 

p值:樣本觀測值在拒絕域方向的概率,利用樣本進行計算,判定p值是否小於顯著性水平即樣本結果是否在拒絕域內。

 

檢驗形式

(1)單側檢驗

通過備擇假設確定左右側,若備擇假設為<,則使用左側,若備擇假設為>,則使用右側。

 

(2)雙側檢驗

拒絕域一分為二位於數據集的兩側,選擇顯著性水平,將拒絕域一分為二,兩側概率各占α/2。

若備擇假設包含不等號≠,需要使用雙側檢驗。

 

 

 

假設檢驗步驟

  • 確定要進行檢驗的假設H0 H1
  • 選擇檢驗統計量
  • 通過顯著性水平確定拒絕域
  • 求出檢驗統計量p值
  • 查看樣本結果是否位於拒絕域內
  • 作出決策

 

例題:

制葯廠宣傳某葯品治愈率能達到90%,醫生隨機抽取了100位病人,只有80人檢測被治愈,還有20位病人未被治愈,我們通過假設檢驗來看下制葯廠的說明是否值得信任。
 
1. 確定假設
H0:p = 0.9
H1:p < 0.9
 
2. 選擇統計量
檢驗統計量 表示樣本中治愈人數,在H0的條件下, 服從二項分布  ~B(100,0.9),二項分布中np、nq均大於5,可用正態分布替代二項分布。
則新檢驗統計量  服從正態分布  ~N(np,npq) ~N(90,9),標准化正態分布可得新檢驗統計量 
 
3. 拒絕域
通過備擇假設確定檢驗形式,本題中由於p < 0.9,所以拒絕域位於左側,在我們已知檢驗統計量后,利用顯著性水平計算拒絕域。
α = 5% ,所以p(Z < c)  = 0.05 ,通過查表可得c = -1.64, c代表拒絕域臨界點,拒絕域位於臨界點左側, 只要樣本檢驗統計量小於c,則有充分理由拒絕H0
 
4. 求p值
p值是樣本觀測值在拒絕域方向的概率。
題目中 治愈人數 = 80,則標准分為 -3.33。
p值計算 = p(Z < -3.33) = 0.0004
 
5. 查看檢驗統計量是否位於拒絕域內
方法1. p值0.0004小於顯著性水平0.05
方法2. 樣本觀測值-3.33位於臨界點左側(拒絕域內)
 
6. 做出決策
在顯著性水平為5%的情況下,有充分利用拒絕原假設。
 
 
2020-05-15 15:43
 
 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM