
5.1 一般總體數學期望的假設檢驗
經常是面對一個隨機變量,其滿足的分布不清楚,此時對總體的未知參數的假設檢驗屬於非正態總體假設檢驗
,即一般總體的假設檢驗問題。在樣本很大(一般,最好
或
),可以使用中心極限定理進行分析。
5.1.1 一個總體均值的大樣本假設檢驗
已知一個總體的均值和方差分別為:,一個樣本的均值和方差分別為:
,當n充分大時,由中心極限定理可知,
近似服從標准正態分布N(0,1)。所以這個問題可以使用U檢驗法進行分析。
實際使用中,總體方差未知情況下,可使用樣本方差
進行替代。
5.1.2 兩個總體均值的大樣本假設檢驗
兩個總體的均值檢驗統計量可以構造如下:

仍然使用U檢驗法進行檢驗。
5.2 假設檢驗問題的p值檢驗法
以上問題均屬於臨界值檢驗法,下面介紹P值檢驗法,所謂P值檢驗法就是由檢驗統計量的樣本觀察值得出的原假設可被拒絕的最小顯著性水水平。
例子:
檢驗牛奶是否加水,牛奶冰點溫度近似滿足正態分布,加水會導致該冰點溫度升高,其均值方差分別為-0.545和0.008,現抽樣5批牛奶,得到均值為-0.534,問這批牛奶是否加水,取顯著性水平為0.05.
首先提出假設:
已知統計量觀察值為:
P值<,所以拒絕
,即認為牛奶加水了。
P值與顯著性水平的關系

臨界值法假設檢驗: 使用顯著性水平得到統計量的拒絕域,結合樣本統計量的值進行統計推斷。
P值法假設檢驗: 由統計量得到P值,然后顯著性水平進行比較得出統計推斷。
5.3 分布擬合檢驗
實際問題中,首先要根據樣本的觀察結果對總體的分布類型進行檢驗。使用檢驗,可以檢驗總體是否具有某個指定的分布或者某個分布簇。
設總體的分布函數為,
未知,
為某一已知分布函數,考慮如下檢驗問題:
不含未知參數時,考慮如下:
對於隨機變量,將其分為k段互不相交的區間,分點依次記為
,記
。
當成立時,有:
,含義是隨機變量落在區間
的概率。假設區間
的長度是
,在n次的隨機實驗中,當
成立且n足夠大時,
是
的近似。
構造統計量1:用於衡量樣本與假設分布的吻合程度。

為給定常數,皮爾遜證明,當
取
時,上面的式子可以變化如下:

含有未知參數時,考慮如下:
通過樣本觀察值
,使用極大似然估計,求出的估計值
,再使用上述公式(1)作統計量分析。
皮爾遜定理:
- 若理論分布函數
不含未知參數,則當
成立且n充分大是,統計量
近似服從自由度為
的
分布;
- 若理論分布函數
含有未知參數,其未知參數個數為r時,統計量
近似服從自由度為
的
分布。
從公式來看,為區間i的實際頻數,
是理論頻數。則統計量的含義可寫為:

給定顯著性水平,
的否定域是
實際使用中,確保n足夠大,不能太小,一般是
,如果
太小,可以進行合並。
例子:
統計200天高速公路的車禍次數,得到下表信息
車禍數i | 0 | 1 | 2 | 3 | 4 |
---|---|---|---|---|---|
頻數n_i | 109 | 65 | 22 | 3 | 1 |
試問,在顯著性水平的情況下,是否認為X滿足泊松分布。
解:
泊松分布含有未知參數,根據樣本觀察結合極大似然估計得到:

提出假設:,若
為真時,總體分布律的估計形式為:

因此,
得,其
因此將
合並到
.
計算得:

合並后,k=4,r=1,查表知:,即
,不滿足拒絕條件,即認為在顯著性水平
下,樣本來自泊松分布。