假設檢驗總結以及如何用python進行假設檢驗(scipy)


幾種常見的假設檢驗總結如下:

假設檢驗名稱

Z檢驗

t檢驗

 χ2檢驗

F檢驗

原假設 

   H0: μ≥μ0        H0: μ≤μ0        H0: μ=μ0  (比較樣本和總體均值)

   H0: μ12≥0   H0: μ12≤0   H0: μ12=0 (比較兩樣本均值)

   H0: μd≥0      H0: μd≤0     H0: μd=0 (比較兩樣本差值均值和假設差值)

H0: σ2≥σ02        H0: σ2≤σ02        H0: σ202  (比較樣本和總體方差)

        H0: σ12≤σ22        H0: σ1222  (比較兩樣本方差,即方差齊性)

H0: 兩類別型變量相互獨立  (獨立性檢驗)

H0: 總體服從某個概率分布  (擬合優度檢驗)

H0: 總體均值都相等  (方差分析)--- 通常用於三個及以上的樣本

備擇假設

   Ha: μ<μ0       Ha: μ>μ0        Ha: μ≠μ0  (比較樣本和總體均值)

Ha: μ12<0  Ha: μ12>0   Ha: μ12≠0 (比較兩樣本均值)

Ha: μd<0     Ha: μd>0     Ha: μd≠0 (比較兩樣本差值均值和假設差值)

 Ha: σ202        Ha: σ202        Ha: σ2≠σ02  (比較樣本和總體方差)

              Ha: σ1222        Ha: σ12≠σ22  (比較兩樣本方差)

Ha: 兩類別型變量不獨立  (獨立性檢驗)

Ha: 總體不服從某個概率分布  (擬合優度檢驗)

Ha: 總體均值不全相等  (方差分析)--- 通常用於三個及以上的樣本

檢驗類型

     左尾        右尾        雙尾

  左尾            右尾          雙尾

檢驗先決條件

 σ已知,總體服從正態分布,若總體分布不服從正態分布,那么樣本量需大於等於30

  σ未知,樣本量可以小於30(當總體服從正態分布時),樣本量大於等於30(總體分布不服從正態分布)

各期望頻數大於5(獨立性檢驗,擬合優度檢驗)

獨立樣本,總體近似正態分布(比較兩樣本方差,即方差齊性)

獨立樣本,總體近似正態分布,總體方差相似(方差分析)

檢驗統計量

(比較樣本和總體均值)

 (比較兩樣本均值)

 

(比較樣本和總體均值)

(比較兩樣本均值,

獨立樣本,兩樣本方差不相等)

(比較兩樣本均值,

獨立樣本,兩樣本方差相等)

(比較兩樣本差值均值和假設差值,

配對樣本)

(比較樣本和總體方差)

(獨立性檢驗)

(擬合優度檢驗)

(比較兩樣本方差)

(單因素方差分析)

決策方法

臨界值法:如果z ≤ -zα,則拒絕原假設(左尾)

          如果z ≥ zα,則拒絕原假設(右尾)

如果z ≤ -zα/2 或 z ≥ zα/2,則拒絕原假設(雙尾)

(如果置信區間不包含μ0,則拒絕原假設)

p值法:如果p值≤α,則拒絕原假設

臨界值法:如果t ≤ -tα,則拒絕原假設(左尾)

          如果t ≥ tα,則拒絕原假設(右尾)

如果t ≤ -tα/2 或 t ≥ tα/2,則拒絕原假設(雙尾)

(如果置信區間不包含μ0,則拒絕原假設)

p值法:如果p值≤α,則拒絕原假設

臨界值法:如果χ2 ≤ χ2(1-α),則拒絕原假設(左尾)

          如果χ2 ≥ χ2α,則拒絕原假設(右尾)

如果χ2 ≤ χ2(1-α) 或 χ2 ≥ χ2α,則拒絕原假設(雙尾)

(如果置信區間不包含σ02,則拒絕原假設)

p值法:如果p值≤α,則拒絕原假設

臨界值法:如果F ≥ Fα,則拒絕原假設(右尾)

如果F ≥ Fα/2,則拒絕原假設(雙尾)

p值法:如果p值≤α,則拒絕原假設

 

注:p值法可以顯示犯第一類錯誤的實際概率,而臨界值法不能。

python命令

 

1,單樣本t檢驗scipy.stats.ttest_1samp (a, popmean)

返回:t檢驗統計量的具體值和相應的p值(雙尾)

2,配對t檢驗scipy.stats.ttest_rel(a,b)

返回:t檢驗統計量的具體值和相應的p值(雙尾)

3,獨立樣本t檢驗

scipy.stats.ttest_ind (a, b, equal_var=True)  scipy.stats.ttest_ind_from_stats (mean1, std1,nobs1,mean2, std2,nobs2, equal_var=True) --- 方差相等

scipy.stats.ttest_ind(a, b, equal_var=False)  scipy.stats.ttest_ind_from_stats (mean1, std1,nobs1,mean2,std2,nobs2, equal_var=False)--- 方差不相等

返回:t檢驗統計量的具體值和相應的p值(雙尾)

1,卡方擬合優度檢驗scipy.stats.chisquare (f_obsf_exp=Noneddof=0)

返回:卡方統計量的具體值和相應的p值

2,卡方獨立性檢驗scipy.stats.chi2_contingency (observed, correction=True)

返回:卡方統計量的具體值,相應的p值,自由度, 期望頻率

3,卡方分布檢驗(比較樣本和總體方差):

計算統計量:

計算p值:p=1-scipy.stats.chi2.cdf(statistic, df)

 

1,Levene檢驗:scipy.stats.levene (sample1,sample2,...)

返回:F統計量的具體值和相應的p值 

2,單因素方差分析scipy.stats.f_oneway (sample1,sample2,...)

 返回:F統計量的具體值和相應的p值 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM