四、假設檢驗


1. 假設檢驗的基本概念

  在總體的分布函數完全未知或只知其形式、 但不知其參數的情況下, 為了推斷總體的某些性質, 提出某些關於總體的假設。

  假設檢驗就是根據樣本對所提出的假設作出判斷: 是接受, 還是拒絕。

基本原理

  小概率推斷原理:小概率事件(概率接近0的事件, 0 ≤ α ≤ 0.05 ), 在一次試驗中,實際上可認為不會發生。

基本思想方法

  采用概率性質的反證法:先提出假設H0 ,再根據 一次抽樣所得到的樣本值進行計算。若導致小概率 事件發生,則否認假設H0 ; 否則,接受假設H

零假設與備選假設

 

顯著性水平

  pass

  數 α 稱為顯著性水平。

檢驗統計量

  pass

零假設與備選假設

  假設檢驗問題通常敘述為: 在顯著性水平 α 下,檢驗假設 H: θ ∈ Θ0 <-->  H:θ ∈ Θ 。. 或稱為 在顯著性水平 α 下,針對 H檢驗 H

  H稱為原假設或零假設,H稱為備選假設。

  注: 一般以保護原假設為基礎,提出原假設。

檢驗規則

  在對問題作出假設以后,需要利用樣本的觀測值,,根據一定的規則作出一種決策,是接受原假設還是拒絕原假設?這種規則就稱為檢驗規則

拒絕域與臨界點

  當檢驗統計量取某個區域 中的值時, 我們拒絕原假設H0 , 則稱區域C為拒絕域, 拒絕域的邊界點稱為臨界點.。拒絕域一般用 W 來表示。

  pass

兩類錯誤的概率和檢驗水平

 

檢驗函數

  由上述檢驗規則以及拒絕域,我們可以定義如下檢驗函數,其實就是一個示性函數 δ(X) :

pass

  在拒絕域值為1, 不在拒絕域值為 0。

兩類錯誤及記號

  假設檢驗的依據是: 小概率事件在一次試驗中很難發生,但很難發生不等於不發生, 因而假設檢驗所作出的結論有可能是錯誤的,這種錯誤有兩類:

(1) 當原假設 H為真,觀察值卻落入拒絕域, 而 作出了拒絕 H的判斷, 稱做第一類錯誤,又叫棄真錯誤,這類錯誤是 “以真為假”。犯第一類錯誤的概率是:

  pass

(2) 當原假設 H不真,而觀察值卻落入接受域,而作出了接受 H0 的判斷, 稱做第二類錯誤, 又叫取偽錯誤 這類錯誤是 “以假為真”。 犯第二類錯誤的概率記為:

  pass

  當樣本容量 n 一定時, 若減少犯第一類錯誤的概率, 則犯第二類錯誤的概率往往增大。若要使犯兩類錯誤的概率都減小, 除非增加樣本容量。

顯著性檢驗

  只對犯第一類錯誤的概率加以控制, 而不考慮犯第二類錯誤的概率的檢驗, 稱為顯著性檢驗。

雙側備選假設與雙側假設檢驗

  假設采用 H:μ = μ0 和 H:μ ≠ μ0  ,備選假設 H1 表示 μ 可能大於 μ0 也可能小於 μ0 ,稱為雙邊備選假設,形如 H:μ = μ0 和 H:μ ≠ μ0  的假設檢驗稱為雙邊假設檢驗。

右邊檢驗與左邊檢驗

  形如  H:μ ≤ μ0 和 H:μ > μ0  的假設檢驗稱為右邊檢驗。

  形如  H:μ ≥ μ0 和 H:μ < μ0  的假設檢驗稱為左邊檢驗。

  右邊檢驗與左邊檢驗統稱為單側檢驗。

一致優於

  若 δ(X) 和 δ(X) 是檢驗問題 H: θ ∈ Θ0 <-->  H:θ ∈ Θ 的顯著性水平為 α 的兩個檢驗,若

E( δ(X) ) ≥ E( δ(X) ),θ ∈ Θ 1

對於一切 θ ∈ Θ 成立, 則稱檢驗 δ(X) 一致優於檢驗 δ(X) 。

  此定義表明在限制第一類錯誤的基礎上,第二類錯誤越小越優,此定義可以推廣至多個檢驗比較。

勢函數與無偏檢驗

  對於檢驗 δ (X),可以定義一個函數 β(θ)  = Eθ ( δ (X) ) = P( X ∈ W ) 稱 β(θ)  為這個檢驗的勢函數,又稱 為功率函數。

注: 

  • 當 θ ∈ Θ時,β(θ) 為犯第一類錯誤的概率,此時 β(θ) 越小越好。
  • 當 θ ∈ Θ時,1 - β(θ) 為犯第二類錯誤的概率,此時 β(θ) 越大越好。

無偏檢驗

  對於檢驗 δ (X),如果棄真錯誤概率  β(θ0) (θ0 ∈ Θ0) 與正確決策概率 β(θ1) (θ1 ∈ Θ1) 之間滿足 β(θ1)  ≥ β(θ0)  稱為水平為 α 的檢驗為無偏檢驗。

  上述條件的假設是勢函數 β 為連續函數。

  此時,β(θ) 在 Θ上越小越好,在 Θ上越大越好。

一致最優勢檢驗

  pass

尾概率

  pass

小結

假設檢驗的一般步驟:

1. 根據實際問題的要求 提出原假設 H和備選假設 H

2.選擇適當的檢驗統計量,在 H成立的條件下,確定它的概率分布;

3.給定顯著性水平 α,確定拒絕域 W; 

4. 根據樣本觀察值計算統計量的值;

5. 根據統計量值是否落入拒絕域 W 中,作出拒絕或者接受 H的判斷。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM