在統計學中,顯著性檢驗是“假設檢驗”中最常用的一種,顯著性檢驗是用於檢測科學實驗中實驗組與對照組之間是否有差異以及差異是否顯著的辦法。
一,假設檢驗
顯著性檢驗是假設檢驗的一種,那什么是假設檢驗?假設檢驗就是事先對總體(隨機變量)的參數或總體分布形式做出一個假設,然后利用樣本信息來判斷這個假設是否合理。
在驗證假設的過程中,總是提出兩個相互對立的假設,把要檢驗的假設稱作原假設,記作H0,把與H0對立的假設稱作備擇假設,記作H1。假設檢驗需要解決的問題是:指定一個合理的檢驗法則,利用已知樣本的數據作出決策,是接受假設H0,還是拒絕假設H0。
1,假設檢驗的基本思想
- 如果原假設為真,而檢驗的結論卻勸你拒絕原假設,把這種錯誤稱之為第一類錯誤(棄真),通常把第一類錯誤出現的概率記為α;就是說,拒絕真假設的概率是α。
- 如果原假設不真,而檢驗的結論卻勸你接受原假設,把這種錯誤稱之為第二類錯誤(取偽),通常把第二類錯誤出現的概率記為β;就是說,接受假假設的概率是β。
二,顯著性檢驗
什么是顯著性檢驗?在給定樣本容量的情況下,我們總是控制犯第一類錯誤的概率α,這種只對犯第一類錯誤的概率加以控制,而不考慮犯第二類錯誤的概率β的檢驗,稱作顯著性檢驗。概率α稱為顯著性水平,顯著性水平是數學界約定俗成的,通常取值有α =5%,2.5%,1% ,代表着顯著性檢驗的結論錯誤率必須低於5%、2.5%和1%。在統計學中,通常把在現實世界中發生幾率小於5%的事件稱之為“不可能事件”。
一般情況下,根據研究的問題,如果拒絕真假設的損失大,為減少這類錯誤,α取值小些,把拒絕真假設的概率降到最低;反之,α取值大些。
在顯著性檢驗中,需要用到檢驗統計量,根據檢驗法則來確定統計量,常用的統計量是Z統計量和t統計量。當檢驗統計量取某個區域C中的值時,拒絕原假設H0,則稱區域C為拒絕域,拒絕域的邊界點稱為臨界點。
顯著性檢驗通常分為兩大類:臨界值法和p值法。
三,檢驗統計量
在統計學中,檢驗統計量是用於檢驗假設的參數是否正確的統計量,檢驗統計量服從一個給定的概率分布。常用的檢驗統計量有t統計量、Z統計量和卡方統計量等。
根據顯著性水平,確認檢驗統計量的拒絕域的臨界點,統計決策所依據的規則如下:




1,Z檢驗統計量
設統計量 Z,n為樣本容量,μ0為樣本均值,σ為標准差,那么Z服從標准正態分布,即Z~N(0,1),這就是在假設檢驗中用到的Z檢驗統計量。
常用於方差σ2已知,而均值μ未知的問題。
2,t檢驗統計量
設統計量t,那么該統計量服從t分布,即t~t(n-1),這就是假設檢驗中經常用到得t檢驗統計量。
常用於方差σ2未知,而均值μ已知的問題。
3,卡方檢驗統計量
設卡方統計量χ2,那么該統計量服從卡方分布,即χ2~χ2(n-1),這就是假設檢驗中經常用到得卡方檢驗統計量。
4,F檢驗統計量
四,臨界法
使用臨界法處理參數的假設檢驗問題的步驟如下:
- 根據實際問題的要求,提出原假設H0和備擇假設H1;
- 給定顯著性水平 α 以及樣本容量n;
- 確定檢驗統計量的形式:構造檢驗統計量,收集樣本數據,計算檢驗統計量的樣本觀察值。
- 確定拒絕域的形式:按P{當H0為真拒絕H0}<=α 求出拒絕域;
- 根據樣本觀測值做出決策,是接受H0還是拒絕H0。
五,顯著性檢驗的實例分析(使用臨界點法來檢驗假設)
某車間用一台包裝機裝糖,袋裝糖的凈重是一個隨機變量,它服從正態分布。當機器正常時,其均值為0.5(kg),標准差為 0.015(kg)。某日開工后,為檢驗包裝機是否工作正常,隨機地抽取它所包裝的9袋糖,稱得凈重為(kg)
0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512
問機器是否正常?
1,分析思路
以μ,σ分別表示這一天袋裝糖的凈重總體X的均值和標准差。由於長期實踐表明標准差比較穩定,設σ=0.015,於是X~N(μ, 0.0152),而總體的均值μ未知。
關鍵點:總體服從正態分布,方差已知,而期望未知。
我們假設總體的均值μ0=0.5,根據樣本來檢驗假設是否成立,即設 原假設 H0:μ=0.5 和 備擇假設 H1:μ!=0.5
由於要檢驗的假設涉及到總體均值,那么使用哪個統計量來檢驗總體均值呢?答案是使用樣本均值,原因主要是有以下兩個:
- 樣本均值
是總體均值μ的無偏估計,
的觀察值
的大小在一定程度上反映了μ的大小,
- 如果原假設H0為真,則觀察值
與的 μ0的偏差|
- μ0 | 一般不會太大;如果 |
- μ0 | 過分大,就有理由懷疑假設H0的正確性而拒絕H0。
所以,考慮使用樣本均值來檢驗總體均值。
根據實際問題,選擇合適的統計量,選擇的標准是:無偏性、可計算差值
樣本的觀察值共有9個,用R很容易計算出樣本的均值=0.512,這個樣本均值是統計量。
> x <- c(0.497, 0.518, 0.524, 0.498, 0.511, 0.520, 0.515, 0.512) > mean(x) [1] 0.511875
由於樣本的均值大於0.5,是否可以判斷出今天的機器不正常?不能,這是因為計算的均值是通過抽樣獲取的,既然是樣本,就可能存在誤差,不能直接使用樣本的均值來作判斷。
也就是說:由於做出決策的依據是一個樣本,當實際上H0為真時,仍可能做出拒絕H0的決策,這種錯誤是無法消除的。
教材是這樣說的:樣本是進行統計推斷的依據,在引用時,往往不是直接使用樣本本身,而是針對不同的問題構造樣本的適當函數,利用這些樣本的函數進行統計推斷。
你能看懂嗎,每個字都認識,就是看不懂。
說人話:通過樣本計算的統計量是有誤差的,對本例而言,樣本的均值
=0.512 是有誤差的,這種誤差是無法消除。因此,不能直接使用樣本來檢驗假設。
敲黑板,划重點:假定有一個總體數據,如果從總體中多次抽樣,那么理論上,每次抽樣所得到的統計量(如期望)與總體參數(如期望)應該差別不大,大致圍繞在總體參數中心,呈正態分布。就是說,樣本統計量和總體參數的差值呈正態分布。
由於無法排除犯這類錯誤的可能性,因此,需要把犯這類錯誤的概率控制在一定限度之內,即給出一個較小的數 α (通常的取值有5%,2.5%,和1%),使犯這類錯誤的概率不超過α,即使得: P{ 當H0為真時拒絕H0 } <= α,設 α=5%。
說人話:根據樣本計算出來的統計量服從一定的分布,即抽樣分布,根據抽樣分布來計算概率。如果統計量的概率小於α,那么接受H0,認為原假設H0是正確的。
當計算樣本統計的概率時,需要用到檢驗統計量,檢驗統計量最好是差值,即樣本統計量和總體的相應統計量的差值,根據差值的分布來檢驗假設。
本例使用Z統計量,Z統計量是樣本統計量的函數,服從N(0, 1),S是樣本標准差,n是樣本容量,μ0是總體均值
接下來就是根據顯著性水平α來確定分位點,正態分布是左右對稱的,所以分位點應該取概率的 α/2 處。
對於正態分布,根據中心極限定理,假設總體均值為0,如果多次抽樣,每次抽樣得到的均值都應該在0附近,如果偏離0太遠,那很有可能並非來自這個總體。
也就是說,Z統計量的概率低於α=5%,接受原假設H0,從圖中可以得出最小的檢驗統計量的值 Zα/2=1.96,由於可得檢驗統計量拒絕域是大於1.96或小於 -1.96
根據樣本的均值計算檢驗統計量的值是:2.4=(0.512-0.5)/(0.015/3),樣本的檢驗統計量位於拒絕域中,因此,拒絕原假設,認為今天的機器有問題。
2,具體的步驟
step1,根據實際問題提出原假設H0和備擇假設H1
設常量:μ0=0.5,為此,提出兩個對立的假設:
原假設 H0:μ=μ0
備擇假設 H1:μ!=μ0
step2,確定檢驗統計量
因為要檢驗的假設涉及到總體均值 μ,所以,考慮借助樣本均值 這一統計量來判斷總體的均值。
由於 是μ的無偏估計,
的觀察值
的大小在一定程度上反映了μ的大小,因此,如果原假設H0為真,則觀察值
與的 μ0的偏差|
- μ0 | 一般不會太大;如果 |
- μ0 | 過分大,就有理由懷疑假設H0的正確性而拒絕H0。
考慮當H0為真時,Z統計量服從N(0,1),即 Z ~N(0,1)
S是樣本的標准差,本例中S=σ=0.015。把Z作為檢驗統計量,衡量|- μ0 | 的大小歸結為衡量統計量Z的大小。
step2,確定顯著性水平和樣本容量
設顯著性水平α=0.05,樣本容量n=9
step4:確定拒絕域的形式
適當選定一正數k,使得當觀察值
就接受原假設H0,否則就拒絕原假設H0。
然而,由於做出決策的依據是一個樣本,當實際上H0為真時,仍可能做出拒絕H0得決策(這種可能性是無法消除的),這是第一類錯誤,犯這類錯誤得概率記作:P{ 當H0為真時拒絕H0 }
由於無法排除犯這類錯誤的可能性,因此,需要把犯這類錯誤的概率控制在一定限度之內,即給出一個較小的數 α (通常的取值有5%,2.5%,和1%),使犯這類錯誤的概率不超過α,即使得:
P{ 當H0為真時拒絕H0 } <= α
為了確定常數k,考慮使用統計量Z,由於只允許犯這類錯誤的概率最大為 α ,得到如下等式:
由於當H0為真時,統計量Z~N(0,1),由標准正態分布分位點的定義得 k=zα/2
如果Z的觀察值滿足 |z|>=k=zα/2,則拒絕H0;如果|z|<k=zα/2,則接受H0。
step5,根據樣本觀測值做出決策
在本例中,α=0.05,則有k=zα/2 =k=z0.025=1.96,又已知n=9,σ=0.015,再由樣本值計算得=0.511,
那么統計量Z的觀測值是:
於是拒絕H0,認為這天包裝機工作不正常。
參考文檔: