1. 假設檢驗的基本概念
在總體的分布函數完全未知或只知其形式、 但不知其參數的情況下, 為了推斷總體的某些性質, 提出某些關於總體的假設。
假設檢驗就是根據樣本對所提出的假設作出判斷: 是接受, 還是拒絕。
基本原理
小概率推斷原理:小概率事件(概率接近0的事件, 0 ≤ α ≤ 0.05 ), 在一次試驗中,實際上可認為不會發生。
基本思想方法
采用概率性質的反證法:先提出假設H0 ,再根據 一次抽樣所得到的樣本值進行計算。若導致小概率 事件發生,則否認假設H0 ; 否則,接受假設H0 。
零假設與備選假設
顯著性水平
pass
數 α 稱為顯著性水平。
檢驗統計量
pass
零假設與備選假設
假設檢驗問題通常敘述為: 在顯著性水平 α 下,檢驗假設 H0 : θ ∈ Θ0 <--> H1 :θ ∈ Θ 1 。. 或稱為 在顯著性水平 α 下,針對 H1 檢驗 H0 。
H0 稱為原假設或零假設,H1 稱為備選假設。
注: 一般以保護原假設為基礎,提出原假設。
檢驗規則
在對問題作出假設以后,需要利用樣本的觀測值,,根據一定的規則作出一種決策,是接受原假設還是拒絕原假設?這種規則就稱為檢驗規則。
拒絕域與臨界點
當檢驗統計量取某個區域 C 中的值時, 我們拒絕原假設H0 , 則稱區域C為拒絕域, 拒絕域的邊界點稱為臨界點.。拒絕域一般用 W 來表示。
pass
兩類錯誤的概率和檢驗水平
檢驗函數
由上述檢驗規則以及拒絕域,我們可以定義如下檢驗函數,其實就是一個示性函數 δ(X) :
pass
在拒絕域值為1, 不在拒絕域值為 0。
兩類錯誤及記號
假設檢驗的依據是: 小概率事件在一次試驗中很難發生,但很難發生不等於不發生, 因而假設檢驗所作出的結論有可能是錯誤的,這種錯誤有兩類:
(1) 當原假設 H0 為真,觀察值卻落入拒絕域, 而 作出了拒絕 H0 的判斷, 稱做第一類錯誤,又叫棄真錯誤,這類錯誤是 “以真為假”。犯第一類錯誤的概率是:
pass
(2) 當原假設 H0 不真,而觀察值卻落入接受域,而作出了接受 H0 的判斷, 稱做第二類錯誤, 又叫取偽錯誤。 這類錯誤是 “以假為真”。 犯第二類錯誤的概率記為:
pass
當樣本容量 n 一定時, 若減少犯第一類錯誤的概率, 則犯第二類錯誤的概率往往增大。若要使犯兩類錯誤的概率都減小, 除非增加樣本容量。
顯著性檢驗
只對犯第一類錯誤的概率加以控制, 而不考慮犯第二類錯誤的概率的檢驗, 稱為顯著性檢驗。
雙側備選假設與雙側假設檢驗
假設采用 H0 :μ = μ0 和 H1 :μ ≠ μ0 ,備選假設 H1 表示 μ 可能大於 μ0 也可能小於 μ0 ,稱為雙邊備選假設,形如 H0 :μ = μ0 和 H1 :μ ≠ μ0 的假設檢驗稱為雙邊假設檢驗。
右邊檢驗與左邊檢驗
形如 H0 :μ ≤ μ0 和 H1 :μ > μ0 的假設檢驗稱為右邊檢驗。
形如 H0 :μ ≥ μ0 和 H1 :μ < μ0 的假設檢驗稱為左邊檢驗。
右邊檢驗與左邊檢驗統稱為單側檢驗。
一致優於
若 δ1 (X) 和 δ2 (X) 是檢驗問題 H0 : θ ∈ Θ0 <--> H1 :θ ∈ Θ 1 的顯著性水平為 α 的兩個檢驗,若
E( δ1 (X) ) ≥ E( δ2 (X) ),θ ∈ Θ 1
對於一切 θ ∈ Θ 1 成立, 則稱檢驗 δ1 (X) 一致優於檢驗 δ2 (X) 。
此定義表明在限制第一類錯誤的基礎上,第二類錯誤越小越優,此定義可以推廣至多個檢驗比較。
勢函數與無偏檢驗
對於檢驗 δ (X),可以定義一個函數 β(θ) = Eθ ( δ (X) ) = P( X ∈ W ) 稱 β(θ) 為這個檢驗的勢函數,又稱 為功率函數。
注:
- 當 θ ∈ Θ0 時,β(θ) 為犯第一類錯誤的概率,此時 β(θ) 越小越好。
- 當 θ ∈ Θ1 時,1 - β(θ) 為犯第二類錯誤的概率,此時 β(θ) 越大越好。
無偏檢驗
對於檢驗 δ (X),如果棄真錯誤概率 β(θ0) (θ0 ∈ Θ0) 與正確決策概率 β(θ1) (θ1 ∈ Θ1) 之間滿足 β(θ1) ≥ β(θ0) 稱為水平為 α 的檢驗為無偏檢驗。
上述條件的假設是勢函數 β 為連續函數。
此時,β(θ) 在 Θ0 上越小越好,在 Θ1 上越大越好。
一致最優勢檢驗
pass
尾概率
pass
小結
假設檢驗的一般步驟:
1. 根據實際問題的要求 提出原假設 H0 和備選假設 H1 ;
2.選擇適當的檢驗統計量,在 H0 成立的條件下,確定它的概率分布;
3.給定顯著性水平 α,確定拒絕域 W;
4. 根據樣本觀察值計算統計量的值;
5. 根據統計量值是否落入拒絕域 W 中,作出拒絕或者接受 H0 的判斷。