誤區一:如果不能拒絕原假設,那么便接受原假設(錯誤)
在多大數假設檢驗的應用中(即顯著性檢驗),雖然對發生第一類錯誤的概率進行了控制,但並沒有控制第二類錯誤發生的概率。因此,如果樣本數據不能拒絕原假設,我們決定接受原假設的話,其實並不能確定該決策有多大的可信度。因此,我們在敘述中通常用“不能拒絕原假設”,而不是“接受原假設”。
“不能拒絕原假設”說明我們對判斷持保留意見。只要未對第二類錯誤發生的概率加以控制,就不能得出接受原假設的結論。在這種情況下,我們只能得出兩種結論:拒絕原假設或不能拒絕原假設。
誤區二:p值代表事件(原假設)發生的概率,p值越小,說明事件越不可能發生(錯誤)
如果p<=α,我們拒絕原假設,這不是說原假設發生的可能性非常小,而是說當原假設為真時,我們錯誤拒絕原假設的概率非常小。
p值表示的是:當原假設為真時,出現樣本檢驗統計量的具體值或更極端結果的概率。也可以說,p 值是犯第一類錯誤的實際概率。
誤區三:把α值設置的越小越好(錯誤)
把α值設置的越小,就是把犯第一類錯誤的概率控制得很小,但是不要忘了,還有犯第二類錯誤的情況呢。對於給定的樣本量,減小α會使β增大,反之,增大α會使β減小。因此,不能毫無必要地選擇非常小的顯著性水平α,否則會增大第二類錯誤發生的概率β。
誤區四:如果p<=0.05,結果就是顯著的(錯誤)
通常,人們會把α值設為0.05,以至於這成了一種通用做法。但在不同的情況下,小概率事件發生的標准是不同的,我們應該用自己的專業知識進行判斷。事實上,不應該只把p值作為評判的手段,最好要計算出置信區間,效應量等。
誤區五:置信度0.95表示有95%的概率,總體參數會落在置信區間內(錯誤)
置信區間是對總體參數的區間估計,因此,每次抽樣計算出的置信區間都不同。要記住,總體參數是不變的,置信區間是包含總體參數的隨機區間。置信度0.95表示有95%的概率,置信區間會包含總體參數。
附:
還有一個地方是我自己剛開始搞暈的。
α:錯誤拒絕原假設的概率。(相當於FN)
β:錯誤接受原假設的概率。(相當於FP)
1-β:正確拒絕原假設的概率。(相當於TN)
注意:α +β 不一定等於 1(基本上除特殊情況外都不等於1,因為它們根本就是兩碼事) 。