幾種常見的假設檢驗總結如下:
假設檢驗名稱 |
Z檢驗 |
t檢驗 |
χ2檢驗 |
F檢驗 |
原假設 |
H0: μ≥μ0 H0: μ≤μ0 H0: μ=μ0 (比較樣本和總體均值) H0: μ1-μ2≥0 H0: μ1-μ2≤0 H0: μ1-μ2=0 (比較兩樣本均值) H0: μd≥0 H0: μd≤0 H0: μd=0 (比較兩樣本差值均值和假設差值) |
H0: σ2≥σ02 H0: σ2≤σ02 H0: σ2=σ02 (比較樣本和總體方差) H0: σ12≤σ22 H0: σ12=σ22 (比較兩樣本方差,即方差齊性) H0: 兩類別型變量相互獨立 (獨立性檢驗) H0: 總體服從某個概率分布 (擬合優度檢驗) H0: 總體均值都相等 (方差分析)--- 通常用於三個及以上的樣本 |
||
備擇假設 |
Ha: μ<μ0 Ha: μ>μ0 Ha: μ≠μ0 (比較樣本和總體均值) Ha: μ1-μ2<0 Ha: μ1-μ2>0 Ha: μ1-μ2≠0 (比較兩樣本均值) Ha: μd<0 Ha: μd>0 Ha: μd≠0 (比較兩樣本差值均值和假設差值) |
Ha: σ2<σ02 Ha: σ2>σ02 Ha: σ2≠σ02 (比較樣本和總體方差) Ha: σ12>σ22 Ha: σ12≠σ22 (比較兩樣本方差) Ha: 兩類別型變量不獨立 (獨立性檢驗) Ha: 總體不服從某個概率分布 (擬合優度檢驗) Ha: 總體均值不全相等 (方差分析)--- 通常用於三個及以上的樣本 |
||
檢驗類型 |
左尾 右尾 雙尾 |
左尾 右尾 雙尾 |
||
檢驗先決條件 |
σ已知,總體服從正態分布,若總體分布不服從正態分布,那么樣本量需大於等於30 |
σ未知,樣本量可以小於30(當總體服從正態分布時),樣本量大於等於30(總體分布不服從正態分布) |
各期望頻數大於5(獨立性檢驗,擬合優度檢驗) |
獨立樣本,總體近似正態分布(比較兩樣本方差,即方差齊性) 獨立樣本,總體近似正態分布,總體方差相似(方差分析) |
檢驗統計量 |
|
獨立樣本,兩樣本方差不相等)
獨立樣本,兩樣本方差相等)
配對樣本) |
|
|
決策方法 |
臨界值法:如果z ≤ -zα,則拒絕原假設(左尾) 如果z ≥ zα,則拒絕原假設(右尾) 如果z ≤ -zα/2 或 z ≥ zα/2,則拒絕原假設(雙尾) (如果置信區間不包含μ0,則拒絕原假設) p值法:如果p值≤α,則拒絕原假設 |
臨界值法:如果t ≤ -tα,則拒絕原假設(左尾) 如果t ≥ tα,則拒絕原假設(右尾) 如果t ≤ -tα/2 或 t ≥ tα/2,則拒絕原假設(雙尾) (如果置信區間不包含μ0,則拒絕原假設) p值法:如果p值≤α,則拒絕原假設 |
臨界值法:如果χ2 ≤ χ2(1-α),則拒絕原假設(左尾) 如果χ2 ≥ χ2α,則拒絕原假設(右尾) 如果χ2 ≤ χ2(1-α) 或 χ2 ≥ χ2α,則拒絕原假設(雙尾) (如果置信區間不包含σ02,則拒絕原假設) p值法:如果p值≤α,則拒絕原假設 |
臨界值法:如果F ≥ Fα,則拒絕原假設(右尾) 如果F ≥ Fα/2,則拒絕原假設(雙尾) p值法:如果p值≤α,則拒絕原假設 |
|
注:p值法可以顯示犯第一類錯誤的實際概率,而臨界值法不能。 |
|||
python命令 |
|
1,單樣本t檢驗:scipy.stats.ttest_1samp (a, popmean) 返回:t檢驗統計量的具體值和相應的p值(雙尾) 2,配對t檢驗:scipy.stats.ttest_rel(a,b) 返回:t檢驗統計量的具體值和相應的p值(雙尾) 3,獨立樣本t檢驗: scipy.stats.ttest_ind (a, b, equal_var=True) 或 scipy.stats.ttest_ind_from_stats (mean1, std1,nobs1,mean2, std2,nobs2, equal_var=True) --- 方差相等 scipy.stats.ttest_ind(a, b, equal_var=False) 或 scipy.stats.ttest_ind_from_stats (mean1, std1,nobs1,mean2,std2,nobs2, equal_var=False)--- 方差不相等 返回:t檢驗統計量的具體值和相應的p值(雙尾) |
1,卡方擬合優度檢驗:scipy.stats.chisquare (f_obs, f_exp=None, ddof=0) 返回:卡方統計量的具體值和相應的p值 2,卡方獨立性檢驗:scipy.stats.chi2_contingency (observed, correction=True) 返回:卡方統計量的具體值,相應的p值,自由度, 期望頻率 3,卡方分布檢驗(比較樣本和總體方差): 計算統計量:
|
1,Levene檢驗:scipy.stats.levene (sample1,sample2,...) 返回:F統計量的具體值和相應的p值 2,單因素方差分析:scipy.stats.f_oneway (sample1,sample2,...) 返回:F統計量的具體值和相應的p值 |