假設檢驗 - 參數檢驗 非參數檢驗 - 置信區間


  1. 假設檢驗

    小概率事件和反證法的應用。

    H0:原假設

    H1:備選假設

    解釋:假設在H0前提下,我們得到目前手頭上的樣本,定義為一個概率事件,概率為α(0.05, 0.01, 0.001),是小概率事件。通過公式計算P值,P<α, 則確認我們得到目前手頭上的樣本是一個小概率事件,而小概率事件在一次試驗中是不可能發生的,但事實發生了,則原假設錯誤,接受備選假設。

    正經解釋:

    H0:只存在抽樣誤差,不存在系統誤差

    H1: 存在抽樣誤差和系統誤差

    在只存在抽樣誤差的前提下,我們得到目前樣本的概率為P,如果P<α,則證明不只是存在抽樣誤差,還存在系統誤差。

 

在參數檢驗中,像t分數,F統計量,卡方統計量等,它的分布是什么形式的,統計學家已經算出來。之所以有分布,是因為變異的存在,分布就是描述變異的規律。

Z分布是均值,率分布規律

T分布是均值差的分布規律

F分布是方差比的分布規律

x2是方差、實際頻數和理論頻數的分布規律

 

接着來:

1. 參數檢驗思想

以 t 分布為例,t 分布是說從均值為u, 方差為 sigma方的正態分布總體中,隨機抽取樣本量為n的樣本,用均值差 / 標准誤,抽一次得到一個 t 分數,抽一萬次得到一萬個 t 分數(這只是描述,實際密度函數是人家推導出來的),從而得到 t 分布規律。

這就是說,在只有抽樣誤差的時候(因為這就是進行的反復抽樣,像正態分布是對樣本不停抽樣,計算均值一樣),95% 的 t 分數是( x1, x2)之間。

提前設定一個拒絕水平(也就是概率值),也就是犯錯概率,就是阿爾法,當 t 分數落到拒絕域對應的區間,我們認為只有抽樣誤差的時候,我們認為 t 是不可能落在這個范圍。alpha這么小,如果我們還犯錯,我們認了。

 

95%解釋:

  1. 在只有抽樣誤差的時候,抽樣一百次,95個 t 分數是( x1, x2)之間。如果樣本 t 分數不屬於這95個之一,我們拒絕原假設。

95%置信區間:

在拒絕原價設的前提下,我們用固定的試驗方法做一百次試驗,計算100個計算區間,有95個包含總體均值。

其實這有兩個95%,第一個是拒絕原假設時,我們有5%幾率犯錯,第二個是在我們這次試驗中,我們計算出一個置信區間,也有5%幾率犯錯。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM