假設檢驗(Hypothesis Testing)


假設檢驗(Hypothesis Testing)

1. 什么是假設檢驗呢?

  假設檢驗又稱為統計假設檢驗,是數理統計中根據一定假設條件由樣本推斷總體的一種方法。

  什么意思呢,舉個生活中的例子:買橘子(借用http://www.360doc.com/content/16/0617/08/31718185_568436468.shtml

  當我們去買橘子的時候,無論甜不甜,老板都會說:“挺甜的,不信拿一個嘗嘗”。我們隨手拿一個(這就相當於抽樣),此時我們對於這些橘子甜或不甜的判斷全基於這個橘子(樣本),為什么不拿總體來判斷呢?老板能讓你把橘子都吃一遍?(大多數情況下無法直接對總體進行判斷)。當我們吃到的橘子是甜的,我們會想,隨便拿一個就是甜的,那么這些橘子大部分都是甜的;當我們吃到的是酸的,我們會想,隨便拿一個就是酸的,我運氣有那么不好嗎,肯定是大部分橘子都是酸的。

  假設檢驗就是對總體(全部橘子)提出假設(甜或不甜),然后通過樣本(隨便拿一個橘子)進行統計計算,來推斷假設是否成立的一種方法。

2.假設檢驗的依據是什么呢?

  假設檢驗重要的依據是人們的一條普遍經驗,即小概率事件在一次實驗中很難發生,如果一旦發生,就認為原來的假設不成立,從而拒絕H0

  例如, 某彩票抽獎處聲稱該彩票中獎概率為p(A) = 99.99%,現在我們做出如下假設

  若假設H0正確,則抽獎一次不中獎的概率為0.01%,這是一個小概率事件。那么我們通過抽獎一次,來檢驗該假設。

 

  假設檢驗的基本思想:先對總體的參數或分布函數的表達式作出某種假設,然后構造出一個在假設成立下出現可能性甚小的事件(即小概率事件)。如果試驗或抽樣的結果使該小概率事件出現了,這與小概率事件原理相違背,表明原來的假設有問題,應予以否定,即拒絕這個假設;若該小概率事件在一次試驗或抽樣中並未出現,就沒有理由否定這個假設,表明試驗或抽樣結果支持這個假設,這時假設與實驗結果是一致的,或者說可以接受這個假設。

  但是,我們要注意的是:在假設檢驗中“拒絕接受反映了決策者在所面對的樣本證據下,對該命題所采取的一種態度、傾向性而不是在邏輯上“證明該命題正確與否!又回到剛開始買橘子的例子,我們在拿一個嘗過后,對所有橘子下的結論(大部分是甜的或者大部分是酸的)都是我們的主觀猜想,而非客觀事實。

3.怎么做假設檢驗呢?

  假設檢驗的一般步驟為:

  (I)跟據實際問題提出零假設(H0)與備擇假設(H1);

  (II)選擇合適的檢驗統計量,並確定在H0為真時的分布;

  (III)給定顯著性水平α,確定臨界點,得到接受域和否定域;

  (IV)計算檢驗統計量的樣本值;

  (V)做出判斷,若值落在否定域,則拒絕H0;若落在接受域,則在所選擇的顯著性水平上,不能拒絕H0

假設

  我們將對總體提出的某種假設稱為零假設(也稱原假設),記為H0;將與原假設矛盾的假設稱為備擇假設(也稱對立假設),記為H1.

  零假設是一種無差別假設,表示要被拒絕的目的。備擇假設是與H0相反的結論。若H0被拒絕,H1就可能被接受。比如,研究兩種葯物對治療同一種疾病的效果不同。這個結論就是要研究的假設,為了檢驗該假設,我們假設用μ表示葯物對疾病的治療效果,寫出原假設H0:μ1 = μ2(相同的治療效果);備擇假設H1:μ1 ≠ μ2(不同的治療效果)。如果得到的信息拒絕H0,則可以接受H1,即兩種葯物對同一疾病的治療效果是不同的。

  H1的敘述是由研究假設的性質確定的。若研究假設只是考察兩個事物有差異,則備擇假設H1:μ1 ≠ μ2;若考察其差值的方向,則H1或者為μ1  > μ2,或者為μ1  < μ2

  我們稱形如

H0 : μ1 = μ2 , H1 : μ1 ≠ μ2

的假設檢驗為雙邊檢驗;

形如

H0 : μ1 ≥ μ2 , H1 : μ1 < μ2

的假設檢驗為左邊檢驗;

形如

H0 : μ1 ≤ μ2 , H1 : μ1 > μ2

的假設檢驗為右邊檢驗。

  左邊檢驗和右邊檢驗統稱為單邊檢驗。

顯著性水平

  前面說到假設檢驗的依據是小概率事件原理,但是,很難發生並不等於絕不發生,因此,在得出對H0的判定時,可能會發生兩類錯誤:第一類錯誤是當H0實際上為真時拒絕H0;第二類錯誤是當H0實際為假時接受H0。第一類錯誤是“以真為假”的錯誤,犯第一類錯誤的概率由α給出,α越大,H0越容易錯誤地被拒絕;第二類錯誤是“以假為真”的錯誤,犯第二類錯誤的概率通常用β表示。可以發現犯這兩類錯誤的概率之間存在反比關系,所以,在樣本量確定為n時,α減小會使β增大。若希望同時減小犯兩類錯誤的可能性,必須增加樣本數目n。

 

  定義α:當原假設H0為真時,假設檢驗統計量的樣本值卻落在接受域之外,因而拒絕原假設H0,這類錯誤稱為第一類錯誤,其發生的概率稱為犯第一類錯誤的概率或稱棄真概率,通常記為α,即

P(拒絕H0 | H0為真) = α

  定義β:當原假設H0為不真時,假設檢驗統計量的樣本值卻落在接受域之內,因而接受原假設H0,這類錯誤稱為第二類錯誤,其發生的概率稱為犯第二類錯誤的概率或稱存偽概率,通常記為β,即

P(接受H0 | H0不真) = β

 

  在實際應用時,我們通常只能控制犯第一類錯誤的概率,也就是錯誤地拒絕H0的概率,這個概率就叫做顯著性水平。一般檢驗時,取α = 0.05,α = 0.01較多。為了保證β不至於太大,樣本數量不能太少在。在生物信息學里,樣本量是很大的,所以β也會很小,因此重點關注α。

否定域

  我們將拒絕零假設H0的區域稱為拒絕域。否定域的大小與顯著性水平α的選取有關。

  否定域的位置(不是大小)與備擇假設H1的性質有關。若H1是指出預定方向的,如H1:μ > μ0,則假設檢驗為單邊檢驗;若H1未指出預定的方向,如H1:μ≠μ0,則為雙邊檢驗。圖1.1是α=0.05的單邊檢驗否定域,圖1.2是α=0.05的雙邊檢驗否定域。可以看出,對於同一顯著性水平α,兩種否定域的位置不同,但總的大小並沒有什么不同。

  在進行統計檢驗時,若根據樣本數據計算的統計量數值落入否定域,則認為零假設H0不成立,稱作在顯著性水平α下拒絕H0;否則認為零假設H0不成立,稱作在顯著性水平α下不能拒絕H0.

 

參考 《非參數統計》易丹輝


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM