寫在前面:之前一直對p值檢驗和假設檢驗的概念混淆不清,有時想明白了,再遇見又忘了。最近發現是由於我一直對顯著性水平的概念的理解有問題,才導致上述問題。下面不推公式,只是簡單寫下自己現在的理解:
一、假設檢驗
假設檢驗是給定原假設H0,備擇假設H1和顯著性水平α,現在我們手里有一個樣本,我們來確定要不要拒絕對這個樣本的假設H0。
我們的流程是首先根據具體假設選擇一個統計量(它滿足正態分布或t分布或......,且可以由樣本統計特性計算得到),顯著性水平是H0正確的情況下拒絕H0的最大概率,即‘棄真’的概率。根據這一條件,我們可以計算得到統計量必須滿足的范圍,也就是我們所說的拒絕域,當根據樣本計算出的統計量值分布在拒絕域時就拒絕原假設H0,否則就接受。
現在我們分析顯著性水平的大小對假設檢驗的影響。當α較大時,即允許棄真錯誤發生的概率大,也即即使H0正確我們也極有可能拒絕H0,說明我們對樣本的要求很高,它的概率分布必須非常滿足假設H0,我們才有可能認為H0是對它的一個正確的假設。反之,α較小時,我們就對樣本的要求沒那么高,很容易就接受假設H0。一個不恰當的極端例子,α為0時,也就是拒絕H0的概率為0,可能無論樣本亂成什么樣,我們都會覺得H0是一個還不錯的假設。
二、p值檢驗
p值檢驗是給定原假設H0,備擇假設H1,現在我們手里還有一個樣本,我們根據樣本需要計算出一個接受或者拒絕H0的臨界顯著性水平,稱為p值。那么當我們拿到一個顯著性水平α時,只要比較α和p的大小,就可以決定要不要拒絕H0。
p值得計算流程應該是首先根據假設確定統計量和拒絕域形式,那么以樣本的統計特性計算得到的統計量值為邊界的一個拒絕域就是拒絕域的臨界形式,其對應的顯著性水平就是我們要求的p值。
可以說,p值的意義就是假設H0為真時,我們觀測到的樣本的顯著性水平。p值較大時,我們傾向於接受原假設H0。
當給定顯著性水平α > p時,前面已經提到顯著性水平越大,對樣本的要求就越高。此時樣本的顯著性水平p小於給定顯著性水平,說明若接受假設H0,我們的樣本並不能滿足顯著性上的要求,所以拒絕H0。反過來α < p時,則接受原假設H0。