統計4：顯著性檢驗

本文轉載自查看原文 2019-01-22 08:27 2766 統計/ 顯著性檢驗

在統計學中，顯著性檢驗是“假設檢驗”中最常用的一種，顯著性檢驗是用於檢測科學實驗中實驗組與對照組之間是否有差異以及差異是否顯著的辦法。

一，假設檢驗

顯著性檢驗是假設檢驗的一種，那什么是假設檢驗？假設檢驗就是事先對總體（隨機變量）的參數或總體分布形式做出一個假設，然后利用樣本信息來判斷這個假設是否合理。

在驗證假設的過程中，總是提出兩個相互對立的假設，把要檢驗的假設稱作原假設，記作H0，把與H0對立的假設稱作備擇假設，記作H1。假設檢驗需要解決的問題是：指定一個合理的檢驗法則，利用已知樣本的數據作出決策，是接受假設H0，還是拒絕假設H0。

1，假設檢驗的基本思想

假設檢驗的基本思想是小概率反證法思想。小概率思想是指小概率事件（P<0.01或P<0.05）在一次試驗中基本上不會發生。反證法思想是先提出原假設(記作假設H0)，再用適當的統計方法確定原假設成立的可能性大小：

若可能性小，則認為原假設不成立；若可能性大，則認為原假設是成立的。

2，假設檢驗的思路

假設檢驗思路是：先假設，后檢驗，通俗地

來說就是要先對數據做一個假設，然后用檢驗來檢查假設對不對。一般而言，把要檢驗的假設稱之為原假設，記為H0；把與H0相對對立（相反）的假設稱之為備擇假設，記為H1。

如果原假設為真，而檢驗的結論卻勸你拒絕原假設，把這種錯誤稱之為第一類錯誤（棄真），通常把第一類錯誤出現的概率記為α；就是說，拒絕真假設的概率是α。
如果原假設不真，而檢驗的結論卻勸你接受原假設，把這種錯誤稱之為第二類錯誤（取偽），通常把第二類錯誤出現的概率記為β；就是說，接受假假設的概率是β。

因此，在確定檢驗法則時，應盡可能使犯這兩類錯誤的概率都較小。一般來說，當樣本容量固定時，如果減少犯一類錯誤的概率，則犯另一類錯誤的概率往往增大。如果要使犯兩類錯誤的概率都減少，除非增加樣本容量。

二，顯著性檢驗

什么是顯著性檢驗？在給定樣本容量的情況下，我們總是控制犯第一類錯誤的概率α，這種只對犯第一類錯誤的概率加以控制，而不考慮犯第二類錯誤的概率β的檢驗，稱作顯著性檢驗。概率α稱為顯著性水平，顯著性水平是數學界約定俗成的，通常取值有α =5%，2.5%，1% ，代表着顯著性檢驗的結論錯誤率必須低於5%、2.5%和1%。在統計學中，通常把在現實世界中發生幾率小於5%的事件稱之為“不可能事件”。

一般情況下，根據研究的問題，如果拒絕真假設的損失大，為減少這類錯誤，α取值小些，把拒絕真假設的概率降到最低；反之，α取值大些。

在顯著性檢驗中，需要用到檢驗統計量，根據檢驗法則來確定統計量，常用的統計量是Z統計量和t統計量。當檢驗統計量取某個區域C中的值時，拒絕原假設H0，則稱區域C為拒絕域，拒絕域的邊界點稱為臨界點。

顯著性檢驗通常分為兩大類：臨界值法和p值法。

三，檢驗統計量

在統計學中，檢驗統計量是用於檢驗假設的參數是否正確的統計量，檢驗統計量服從一個給定的概率分布。常用的檢驗統計量有t統計量、Z統計量和卡方統計量等。

根據顯著性水平，確認檢驗統計量的拒絕域的臨界點，統計決策所依據的規則如下：

(1)給定顯著性水平α，查表得出相應的臨界值

或

，

或

；

(2)將檢驗統計量的值與α水平的臨界值進行比較；如果檢驗統計量取拒絕域中的值，則拒絕原假設。

1，Z檢驗統計量

設統計量 Z，n為樣本容量，μ0為樣本均值，σ為標准差，那么Z服從標准正態分布，即Z~N(0,1)，這就是在假設檢驗中用到的Z檢驗統計量。

常用於方差σ²已知，而均值μ未知的問題。

2，t檢驗統計量

設統計量t，那么該統計量服從t分布，即t~t(n-1)，這就是假設檢驗中經常用到得t檢驗統計量。

常用於方差σ²未知，而均值μ已知的問題。

3，卡方檢驗統計量

設卡方統計量χ2，那么該統計量服從卡方分布，即χ2~χ2(n-1)，這就是假設檢驗中經常用到得卡方檢驗統計量。

4，F檢驗統計量

四，臨界法

使用臨界法處理參數的假設檢驗問題的步驟如下：

根據實際問題的要求，提出原假設H0和備擇假設H1；
給定顯著性水平 α 以及樣本容量n；
確定檢驗統計量的形式：構造檢驗統計量，收集樣本數據，計算檢驗統計量的樣本觀察值。
確定拒絕域的形式：按P{當H0為真拒絕H0}<=α 求出拒絕域；
根據樣本觀測值做出決策，是接受H0還是拒絕H0。

五，顯著性檢驗的實例分析（使用臨界點法來檢驗假設）

某車間用一台包裝機裝糖，袋裝糖的凈重是一個隨機變量，它服從正態分布。當機器正常時，其均值為0.5（kg），標准差為 0.015（kg）。某日開工后，為檢驗包裝機是否工作正常，隨機地抽取它所包裝的9袋糖，稱得凈重為（kg）

0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512

問機器是否正常？

1，分析思路

以μ，σ分別表示這一天袋裝糖的凈重總體X的均值和標准差。由於長期實踐表明標准差比較穩定，設σ=0.015，於是X~N(μ, 0.015²)，而總體的均值μ未知。

關鍵點：總體服從正態分布，方差已知，而期望未知。

我們假設總體的均值μ₀=0.5，根據樣本來檢驗假設是否成立，即設原假設 H0：μ=0.5 和備擇假設 H1：μ!=0.5

由於要檢驗的假設涉及到總體均值，那么使用哪個統計量來檢驗總體均值呢？答案是使用樣本均值，原因主要是有以下兩個：

樣本均值是總體均值μ的無偏估計，的觀察值的大小在一定程度上反映了μ的大小，
如果原假設H0為真，則觀察值與的 μ₀的偏差|- μ₀| 一般不會太大；如果 |- μ₀| 過分大，就有理由懷疑假設H0的正確性而拒絕H0。

所以，考慮使用樣本均值來檢驗總體均值。

根據實際問題，選擇合適的統計量，選擇的標准是：無偏性、可計算差值

樣本的觀察值共有9個，用R很容易計算出樣本的均值=0.512，這個樣本均值是統計量。

> x <- c(0.497, 0.518, 0.524, 0.498, 0.511, 0.520, 0.515, 0.512)
> mean(x)
[1] 0.511875

由於樣本的均值大於0.5，是否可以判斷出今天的機器不正常？不能，這是因為計算的均值是通過抽樣獲取的，既然是樣本，就可能存在誤差，不能直接使用樣本的均值來作判斷。

也就是說：由於做出決策的依據是一個樣本，當實際上H0為真時，仍可能做出拒絕H0的決策，這種錯誤是無法消除的。

教材是這樣說的：樣本是進行統計推斷的依據，在引用時，往往不是直接使用樣本本身，而是針對不同的問題構造樣本的適當函數，利用這些樣本的函數進行統計推斷。

你能看懂嗎，每個字都認識，就是看不懂。

說人話：通過樣本計算的統計量是有誤差的，對本例而言，樣本的均值=0.512 是有誤差的，這種誤差是無法消除。因此，不能直接使用樣本來檢驗假設。

敲黑板，划重點：假定有一個總體數據，如果從總體中多次抽樣，那么理論上，每次抽樣所得到的統計量（如期望）與總體參數（如期望）應該差別不大，大致圍繞在總體參數中心，呈正態分布。就是說，樣本統計量和總體參數的差值呈正態分布。

由於無法排除犯這類錯誤的可能性，因此，需要把犯這類錯誤的概率控制在一定限度之內，即給出一個較小的數 α (通常的取值有5%，2.5%，和1%)，使犯這類錯誤的概率不超過α，即使得： P{ 當H0為真時拒絕H0 } <= α，設 α=5%。