概率統計23——假設檢驗理論(2)


假設檢驗實際上是用反證法做出非對即錯的判斷:先假定原假設是對的,然后將抽樣數據代入相應的分布中去驗證,觀察原假設的數值是落在接受域還是拒絕域,由此做出是接受還是拒絕原假設的判斷。

值得注意的是,不同於以往嚴格的數學證明,假設檢驗是建立在小概率事件原理的基礎之上。由於小概率事件也有可能發生,因此並不能百分之百確定原假設一定不成立,也就是說,原假設也有判斷錯誤的時候。

兩種錯誤類型

假設檢驗有兩種判斷錯誤的類型,統計學家給出了專業的名稱:第一類錯誤和第二類錯誤。

第一類錯誤(false reject):錯誤地拒絕,H0是對的,卻拒絕了它。也就是說,計算結果落在拒絕域,但真實結果是在接受域。

第二類錯誤(false accept):錯誤地接受,H0是錯的,卻接受了它。也就是說,計算結果落在接受域,但真實結果是在拒絕域。

第一類錯誤也叫Ⅰ 型錯誤或棄真錯誤,第二類錯誤也叫Ⅱ 型錯誤或存偽錯誤。我覺得還是忘記這些文縐縐名稱,記住false reject和false accept即可,畢竟這兩個英文短語更直白,更容易理解。

 

假設檢驗的理想情況是能過做出與實際相符的正確斷言,但由於抽樣數據的隨機性,根據樣本計算的統計量必然會與整體的真實數值存在差異,這種差異可能導致出現四種判斷結果:

錯誤的概率

既然假設檢驗無法保證百分之百有效,那么我們就需要研究兩類錯誤出現的概率,由此將假設檢驗的功效數值化。

 

先來看第一類錯誤。

第一類錯誤是在H0正確的時候錯誤地卻拒絕了它,這就意味着我們的判斷結果落在了拒絕域內:

 

 結果落在拒絕域內的概率與顯著性水平一致,因此α的數值決定了出現第一類錯誤概率:

 

隨着α的減小,第一類錯誤出現的概率也隨之減小。當α=0時,第一類錯誤完全消失,也就是永遠不會拒絕H0,這有點像過去的“守舊派”對於“法先王”的絕對擁護,無論時代怎么進步,“法先王”都必須服從,任何改革都視為大逆不道。

可以看出,由於α的值很小,所以犯第一類錯誤的幾率也很小。

 

再來看第二類錯誤。

第二類錯誤是在H0錯誤的時候接受了它,一個本應落在拒絕域內的點卻落在了接受域內:

 

 我們用β表示第二類錯誤出現的概率,只要α確定了,β也就確定了。一個草率的判斷是β=1-α,按照這種計算方式,β=0.95,這意味着第二類錯誤出現的概率高達95%!如果這樣,那么假設檢驗還有什么用?

實際上β的計算比α難得多。

   

我們延用產品元件的故事。μ0是改善前總體的均值,μ1是改善后總體的均值,改善前后的標准差一致,都是σ=6。

原假設H0:改善前與改善后是同一個正態分布,μ01=600。

備擇假設H1:改善前與改善后是不同的正態分布,μ0 =600< μ1=603。

公司用新技術制造了大量元件,從中多次抽取容量是m(m≥30)的樣本進行檢驗。根據中心極限定理,樣本均值的分布服從均值為總體均值,方差為總體方差1/m的正態分布:

對樣本均值進行標准化處理:

使用0.05顯著性水平,在標准正態分布下,查表可知臨界值是1.645。

當Z0 > 1.645時,將拒絕H0假設。

再來看均值的逆運算:

也就是說,如果抽樣的均值大於601.802,就應該拒絕相信H0

現在可以計算出標准正態分布下β區域的臨界值:

 

 

結論是,如果改善后的功率均值是603,那么以此為條件,犯第二類錯誤的概率是β=0.137。通過β的計算過程可以看出,只有當H1假設是一個固定的值時,才能計算出β。如果H1假設不是固定,比如只給出了μ1 > 603,那么將無法根據①計算出z1,也就無法進一步求得β

 

一個常見的問題是,既然一開始就知道了H0和H1的均值和方差,為什么還要使用標准化處理?直接計算臨界值豈不是更簡單?

我們的確可以直接通過計算機解求得X~(μ0, σ2)時的臨界值,但這是總體分布下的臨界值,而我們的假設檢驗是基於抽樣,並非總體,此時用到的理論是中心極限定理,因此才大費周章地使用標准化形態。

 


   出處:微信公眾號 "我是8位的"

  本文以學習、研究和分享為主,如需轉載,請聯系本人,標明作者和出處,非商業用途! 

   掃描二維碼關注作者公眾號“我是8位的”

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM