Chapter 5:多元正態分布的假設檢驗(1)
一、單個總體均值向量的檢驗
Part 1:協方差陣已知的均值向量的檢驗
設 \(X_{(\alpha)},\,\alpha=1,2,\cdots,n\) 為多元正態總體 \(X\sim N_p\left(\mu,\Sigma\right)\) 的獨立同分布的樣本,其中 \(\Sigma>0\) 已知,考慮以下檢驗問題
方法一:檢驗統計量
構造檢驗統計量
對於給定的顯著性水平 \(\alpha\) ,檢驗的拒絕域為
方法二:似然比檢驗
寫出樣本的聯合密度函數
在 \(H_1\) 和 \(H_0\) 假設下的極大似然分別為
構造似然比統計量為
當樣本容量 \(n\) 很大時,
對於給定的顯著性水平 \(\alpha\) ,檢驗的拒絕域為
可以發現,這里的似然比檢驗與構造檢驗統計量的結果一致。
Part 2:協方差陣未知的均值向量的檢驗
設 \(X_{(\alpha)},\,\alpha=1,2,\cdots,n\) 為多元正態總體 \(X\sim N_p\left(\mu,\Sigma\right)\) 的獨立同分布的樣本,\(\mu\) 和 \(\Sigma\) 未知,\(\Sigma>0\),考慮以下檢驗問題
方法一:檢驗統計量
構造檢驗統計量
對於給定的顯著性水平 \(\alpha\) ,檢驗的拒絕域為
方法二:似然比檢驗
寫出樣本的聯合密度函數
此時的參數空間為
在 \(H_1\) 假設下的極大似然為
在 \(H_0\) 假設下的極大似然為
其中
構造似然比統計量為
由於 \(\lambda\) 為 \(T^2\) 的嚴格單調遞減函數,故這里的似然比檢驗等價於 \(T^2\) 統計量檢驗,即
然后構造 \(F\) 統計量並求出拒絕域即可。
二、均值向量的區間估計
Part 1:均值向量的置信域
多元統計中的置信域是對一元統計中的置信區間的推廣,和我們后面討論的聯立置信區間在概念上有一點點區別。
考慮單正態總體檢驗的 \(T^2\) 統計量:
以及相應的 \(F\) 統計量:
則有均值向量 \(\mu\) 的置信度為 \(1-\alpha\) 的置信域為
該置信域是一個以 \(\bar{X}\) 為中心的橢球:
Part 2:均值向量的聯立置信區間
這里我們主要考慮 \(\mu\) 的線性組合 \(a'\mu\) 的置信區間,這里 \(a\) 是一個 \(p\) 維的非零常數向量,所以 \(\mu\) 的聯立置信區間,其上限和下限都是與 \(a\) 有關的。
若 \(\Sigma\) 已知,采用正態區間,取樞軸量為
所以 \(a'\mu\) 的置信度為 \(1-\alpha\) 的置信區間為
若 \(\Sigma\) 未知,采用 \(t\) 區間,取樞軸量為
所以 \(a'\mu\) 的置信度為 \(1-\alpha\) 的置信區間為
對於以上兩種情況,如果取 \(a=e_i=\left(0,\cdots,1,\cdots,0\right)'\) ,即取 \(e_i\) 為第 \(i\) 個分量為 \(1\) 而其余均為 \(0\) 的向量,則可以得到均值向量 \(\mu\) 的第 \(i\) 個分量 \(\mu_i\) 的置信度為 \(1-\alpha\) 的置信區間,不妨設為 \(D_i\) 。通過選擇不同的常數向量 \(a\) ,便可得到 \(\mu\) 的所有分量的置信度為 \(1-\alpha\) 的置信區間。需要注意,此時總的置信區間為一個立方體 \(D_1\times D_2\times \cdots\times D_p\) ,但總的置信度比 \(1-\alpha\) 小。
Part 3:均值向量的最大置信區間
這里我們還是考慮 \(\mu\) 的線性組合 \(a'\mu\) 的置信區間,但如果使用如上所述的一元數理統計方法,得到的並不是最大的置信區間。下面我們主要考慮協方差陣 \(\Sigma\) 未知的情況。
取樞軸量的平方
由二次型的極值性質可知,當 \(a\) 與 \(S^{-1}\left(\bar{X}-\mu\right)\) 成比例時,該樞軸量的平方達到最大值,即
對於任意的 \(a\neq0\) 都有
所以 \(a'\mu\) 的置信度為 \(1-\alpha\) 的最大置信區間為
事實上,Hotelling \(T^2\) 統計量找到了某個向量 \(a\) ,是的均值向量投影在該方向上具有最大的置信區間。也就是說,對於一組樣本,如果它的 Hotelling \(T^2\) 統計量沒有落入置信區間,那么其余所有 \(a'\mu\) 都不會落入其對應的置信區間。
類似地,如果取 \(a=e_i=\left(0,\cdots,1,\cdots,0\right)'\) ,則可以得到 \(\mu_i\) 的置信度為 \(1-\alpha\) 的最大置信區間
其中 \(S_{ii}\) 為 \(S\) 的第 \(i\) 個對角線元素,但此時總的置信度仍然比 \(1-\alpha\) 小。
Part 4:均值向量的聯合置信區間
聯合置信區間直接考慮 \(\mu\) 的每個分量 \(\mu_i\) 的置信區間,通過直積得到總的置信區間,並且要求總的置信度等於 \(1-\alpha\) 。這里我們需要對 \(\mu_i\) 設置一個較大的置信區間 \(1-\alpha_i\) 。記
則有 \(P\left(D_i\right)=1-\alpha_i\) 。如果進一步滿足
則稱 \(D_1\times D_2\times\cdots\times D_p\) 為均值向量 \(\mu\) 在置信度為 \(1-\alpha\) 下的聯合置信區間。
一般地,我們常取 \(\alpha_i=\alpha/p\) ,即有 \(P(D_i)=1-\alpha/p\) 。
三、兩個總體均值向量的檢驗
Part 1:協方差陣相等且已知的檢驗
設 \(X_{(\alpha)},\,\alpha=1,2,\cdots,n\) 和 \(Y_{(\alpha)},\,\alpha=1,2,\cdots,m\) 分別為多元正態總體 \(X\sim N_p\left(\mu_1,\Sigma\right)\) 和 \(Y\sim N_p\left(\mu_2,\Sigma\right)\) 的獨立同分布的樣本,其中 \(\Sigma>0\) 已知,考慮以下檢驗問題
構造檢驗統計量
對於給定的顯著性水平 \(\alpha\) ,檢驗的拒絕域為
檢驗統計量的分布證明如下:
\[\bar{X}\sim N_p\left(\mu_1,\frac{\Sigma}{n}\right) \ , \quad \bar{Y}\sim N_p\left(\mu_2,\frac{\Sigma}{m}\right) \ . \]在 \(H_0\) 假設下有
\[\bar{X}-\bar{Y}\sim N_p\left(0,\frac{\Sigma}{n}+\frac{\Sigma}{m}\right) \ . \]所以有
\[Z=\Sigma^{-1/2}\frac{\bar{X}-\bar{Y}}{\sqrt{\cfrac1n+\cfrac1m}}\sim N_p\left(0,I_p\right) \ . \]構造檢驗統計量
\[K^2=Z'Z=\left(\frac{nm}{n+m}\right)\left(\bar{X}-\bar{Y}\right)'\Sigma^{-1}\left(\bar{X}-\bar{Y}\right)\sim\chi^2(p) \ . \]
Part 2:協方差陣相等但未知的檢驗
設 \(X_{(\alpha)},\,\alpha=1,2,\cdots,n\) 和 \(Y_{(\alpha)},\,\alpha=1,2,\cdots,m\) 分別為多元正態總體 \(X\sim N_p\left(\mu_1,\Sigma\right)\) 和 \(Y\sim N_p\left(\mu_2,\Sigma\right)\) 的獨立同分布的樣本,其中 \(\Sigma>0\) 但未知,考慮以下檢驗問題
構造檢驗統計量
其中 \(A_1\) 和 \(A_2\) 是兩總體的樣本離差陣,構造 \(F\) 統計量
對於給定的顯著性水平 \(\alpha\) ,檢驗的拒絕域為
檢驗統計量的分布證明如下:
\[\bar{X}\sim N_p\left(\mu_1,\frac{\Sigma}{n}\right) \ , \quad \bar{Y}\sim N_p\left(\mu_2,\frac{\Sigma}{m}\right) \ . \]在 \(H_0\) 假設下有
\[\sqrt{\frac{mn}{m+n}}\left(\bar{X}-\bar{Y}\right)\sim N_p\left(0,\Sigma\right) \ . \]又因為
\[A_1=\sum_{\alpha=1}^n\left(X_{(\alpha)}-\bar{X}\right)\left(X_{(\alpha)}-\bar{X}\right)'\sim W_p(n-1,\Sigma) \ , \\ A_2=\sum_{\alpha=1}^m\left(Y_{(\alpha)}-\bar{Y}\right)\left(Y_{(\alpha)}-\bar{Y}\right)'\sim W_p(m-1,\Sigma) \ , \]且 \(A_1\) 與 \(A_2\) 相互獨立,所以有
\[A_1+A_2\sim W_p\left(n+m-2,\Sigma\right) \ . \]構造檢驗統計量
\[\begin{aligned} T^2&=(n+m-2)\left[\sqrt{\frac{mn}{m+n}}\left(\bar{X}-\bar{Y}\right)\right]'\left(A_1+A_2\right)^{-1}\left[\sqrt{\frac{mn}{m+n}}\left(\bar{X}-\bar{Y}\right)\right] \\ \\ &=\frac{nm}{n+m}\left(\bar{X}-\bar{Y}\right)'\left(\frac{A_1+A_2}{n+m-2}\right)^{-1}\left(\bar{X}-\bar{Y}\right) \\ \\ &\sim T^2(p,n+m-2)\ . \end{aligned} \]
Part 3:協方差陣不等但已知的檢驗
設 \(X_{(\alpha)},\,\alpha=1,2,\cdots,n\) 和 \(Y_{(\alpha)},\,\alpha=1,2,\cdots,m\) 分別為多元正態總體 \(X\sim N_p\left(\mu_1,\Sigma_1\right)\) 和 \(Y\sim N_p\left(\mu_2,\Sigma_2\right)\) 的獨立同分布的樣本,其中 \(\Sigma_1>0,\,\Sigma_2>0\) 且已知,考慮以下檢驗問題
構造檢驗統計量
對於給定的顯著性水平 \(\alpha\) ,檢驗的拒絕域為
檢驗統計量的分布證明如下:
\[\sqrt{n}\left(\bar{X}-\mu_1\right)\sim N_p\left(0,\Sigma_1\right) \ , \quad \sqrt{m}\left(\bar{Y}-\mu_2\right)\sim N_p\left(0,\Sigma_2\right) \ . \]在 \(H_0\) 假設下有
\[\bar{X}-\bar{Y}\sim N_p\left(0,\frac{\Sigma_1}{n}+\frac{\Sigma_2}{m}\right) \ . \]所以有
\[Z=\left(\frac{\Sigma_1}{n}+\frac{\Sigma_2}{m}\right)^{-1/2}\left(\bar{X}-\bar{Y}\right)\sim N_p\left(0,I_p\right) \ . \]構造檢驗統計量
\[K^2=Z'Z=\left(\bar{X}-\bar{Y}\right)'\left(\frac{\Sigma_1}{n}+\frac{\Sigma_2}{m}\right)^{-1}\left(\bar{X}-\bar{Y}\right)\sim\chi^2(p) \ . \]
Part 4:協方差陣不等且未知的檢驗
我們只考慮樣本容量相等的情況。若樣本容量不相等,這類問題的檢驗統計量沒有小樣本分布,故在此不進行討論。
設 \(X_{(\alpha)},Y_{(\alpha)},\,\alpha=1,2,\cdots,n\) 分別為多元正態總體 \(X\sim N_p\left(\mu_1,\Sigma_1\right)\) 和 \(Y\sim N_p\left(\mu_2,\Sigma_2\right)\) 的獨立同分布的樣本,其中 \(\Sigma_1>0,\,\Sigma_2>0\) 但均未知,考慮以下檢驗問題
令 \(Z_{(i)}=X_{(i)}-Y_{(i)},\,i=1,2,\cdots,n\) ,將問題轉化為單個總體的均值向量假設檢驗問題
構造 \(T^2\) 統計量和相應的 \(F\) 統計量即可。注意,這里 \(X\) 和 \(Y\) 相互獨立的信息沒有利用。
檢驗統計量的分布證明如下:
\[Z=X-Y\sim N_p\left(\mu_1-\mu_2,\Sigma_1+\Sigma_2\right) \ . \]在 \(H_0\) 假設下有
\[\bar{Z}\sim N_p\left(0,\frac{1}{n}\left(\Sigma_1+\Sigma_2\right)\right) \ . \]后面按照協方差陣未知的均值向量的檢驗進行即可。
四、均值向量線性約束假設的檢驗
Part 1:線性約束假設問題
設 \(X_{(\alpha)},\,\alpha=1,2,\cdots,n\) 為多元正態總體 \(X\sim N_p\left(\mu,\Sigma\right)\) 的獨立同分布的樣本,設 \(H_0:R\mu=r\) 為一個線性約束,其中 \(R,r\) 為已知的矩陣和向量,且 \(R\) 是 \(q\times p\) 的滿秩矩陣,下面對 \(H_0\) 進行假設檢驗。
如果 \(\Sigma\) 已知,則有
故構造檢驗統計量
如果 \(\Sigma\) 未知,則有
故構造檢驗統計量
對應的 \(F\) 統計量為
可以證明,利用似然比檢驗會得到和上述檢驗統計量相同的結果。
Part 2:均值向量的球性檢驗
這是線性約束假設問題的一個應用。設 \(X_{(\alpha)},\,\alpha=1,2,\cdots,n\) 為多元正態總體 \(X\sim N_p\left(\mu,\Sigma\right)\) 的獨立同分布的樣本,球型檢驗指的是檢驗 \(H_0:\mu_1=\mu_2=\cdots=\mu_p\) 和 \(H_1:\mu_1,\mu_2,\cdots,\mu_p\) 至少有一對不相等。
將原假設表示為線性約束
構造檢驗統計量
對應的 \(F\) 統計量為