注:區間估計是除點估計之外的另一類參數估計。相對於點估計只給出一個具體的數值,區間估計能夠給出一個估計的范圍。
0. 點估計 vs 區間估計
根據具體樣本觀察值,點估計提供了一個明確的數值。但是這種判斷的把握有多大,點估計本身並沒有給出。區間估計就是為了彌補點估計的這種不足而提出來的。
相同點:
- 都可以給出未知參數的估計;
- 估計的准確度都依賴取樣的質量.
不同點:
- 點估計需要的信息少(矩估計僅需要樣本信息),得到的估計值也比較粗略;
- 區間估計需要的信息更多(除了樣本,還需要知道總體或樣本的某些數字特征的分布形式),得到的結果是包含置信水平的一個區間.
區間估計:
設$X$是總體,$X_1, ..., X_n$是一個樣本. 區間估計的目的是找到兩個統計量:
$\hat{\theta_1} = \hat{\theta_1}(X_1, ..., X_n),$
$\hat{\theta_2} = \hat{\theta_2}(X_1, ..., X_n),$
使隨機區間$(\hat{\theta_1}, \hat{\theta_2})$以一定可靠程度蓋住$\theta$.
1. 置信水平和置信區間
1.1 定義
設總體$X$的分布函數$F(x;\theta)$, $\theta$未知. 對給定值$\alpha(0< \alpha <1)$,有兩個統計量
$\hat{\theta_L} = \hat{\theta_L}(X_1, ..., X_n),\ \hat{\theta_U} = \hat{\theta_U}(X_1, ..., X_n), $
使得:$P\{\hat{\theta_L}(X_1, ..., X_n) < \theta < \hat{\theta_U}(X_1, ..., X_n)\} \geq 1 - \alpha$
則$(\hat{\theta_L}, \hat{\theta_U})$稱為$\theta$的置信水平為$1 - \alpha$的雙側置信區間;
$\hat{\theta_L}$和$\hat{\theta_U}$分別稱為雙側置信下限和雙側置信上限.
1.2 說明
參數$\theta$雖然未知,但是確定的值。$\hat{\theta_L}, \hat{\theta_U}$是統計量,隨機的,依賴於樣本;
置信區間$(\hat{\theta_L}, \hat{\theta_U})$也是隨機的,依賴於樣本。樣本不同,算出來的區間也不同。
對於有些樣本觀察值,區間覆蓋$\theta$,但對於另一些樣本觀察值,區間則不能覆蓋$\theta$。
例題1
設總體$X \sim N(\mu, 4)$, $\mu$未知,$X_1, ..., X_4$是一個樣本。則$\bar{X} \sim N(\mu, 1)$(樣本均值的分布).
$P(\bar{X} - 2 < \mu < \bar{X} + 2) = P(|\bar{X} - \mu| < 2) = 2\Phi(2) - 1 = 0.9544$
=> $(\bar{X} - 2, \bar{X} + 2)$是$\mu$的置信水平為0.95的置信區間。
若$\mu = 0.5$(總體均值的真實值,待估計值),當$\bar{x}$分別為3, 2,1時,對應區間為:$(1, 5), (0, 4), (-1, 3)$
對於一個具體的估計結果而言,或者包含真值(后兩個區間),或者不包含真值(第一個區間),無概率可言。這就像是某產品的合格率是99%,但是對每一個具體的消費者而言,買到的產品要么是合格品要么是次品,沒有概率可言;但是從消費者群體來看,99%表示如果有10000個人購買了這件商品,會有100個人買到次品。
1.3 單側置信區間
如果$P\{\hat{\theta_L}(X_1, ..., X_n) < \theta\} \geq 1 - \alpha$,則$\hat{\theta_L}$稱為參數$\theta$的置信水平$1 - \alpha$的單側置信下限;
如果$P\{\theta < \hat{\theta_U}(X_1, ..., X_n)\} \geq 1 - \alpha$,則$\hat{\theta_U}$稱為參數$\theta$的置信水平$1 - \alpha$的單側置信上限;
單側置信限和雙側置信區間的關系:
設$\hat{\theta_L}$是$\theta$的置信水平為$1 - \alpha_1$的單側置信下限,$\hat{\theta_U}$是$\theta$的置信水平為$1 - \alpha_2$的單側置信上限,則$(\hat{\theta_L}, \hat{\theta_U})$是$\theta$的置信度為$1 - \alpha_1 - \alpha_2$的雙側置信區間。表示成公式如下(通常下面的$\alpha_1$和$\alpha_2$都是非常小的值):
$P\{\hat{\theta_L} >= \theta\} \leq \alpha_1$, $P\{\theta \geq \hat{\theta_U}\} \leq \alpha_2$, =>
$P\{\hat{\theta_L} < \theta < \hat{\theta_U}\} = 1 - P\{\hat{\theta_L} \geq \theta\} - P\{\hat{\theta_U} \leq \theta\} \geq 1 - \alpha_1 - \alpha_2$.
相當於:$\theta$小於$\hat{\theta_L}$的概率非常小,$\theta$大於$\hat{\theta_U}$的概率也非常小,那么$\theta$在這兩者之間的概率就比較大。
1.4 精確度
置信區間$(\hat{\theta_L}, \hat{\theta_U})$的平均長度$E(\hat{\theta_U} - \hat{\theta_L})$為區間的精確度,精確度的一半為誤差限。(因為每次抽樣獲得的數據點不同 => 每次得到的樣本均值和方差不同 => 在置信水平一定的情況下,置信區間的長度不同)
在給定的樣本容量下,置信水平和精確度是相互制約的。置信水平越高,精確度越低;相反精確度越高,置信水平越低。置信水平確定了置信區間的大小,如果置信水平非常高(例如接近1),那么置信區間就會非常寬。這個時候,無論怎么抽樣,得到的區間估計幾乎總會包含待估計的真值。但是由於范圍太大了,這個估計的區間也就失去了意義(精確度太低)。例如,需要估計一個中等規模的電影院里每天來看電影的人數,如果我們估計的區間是$[1, 100000]$,這個估計的置信水平非常高(真實觀影人數肯定是在這個區間),但是這樣的估計幾乎沒什么價值。
1.5 對置信區間的理解
一般地,$P\{\hat{\theta_L}(X_1, ..., X_n) < \theta < \hat{\theta_U}(X_1, ..., X_n)\} = 1 - \alpha$,則置信區間$(\hat{\theta_L}, \hat{\theta_U})$的含義為:
反復抽樣多次(例如$m$次,每次都隨機抽出$n$個數據點),這些抽到的樣本(共$m$個樣本,$m*n$個數據點),每一個都能確定一個區間$(\hat{\theta_L}^{(i)}, \hat{\theta_U}^{(i)})$(第$i$次抽樣進行區間估計后確定的區間),每個這樣的區間可能包含真值$\theta$,也可能不包含真值$\theta$。按照伯努利大數定律,當抽樣次數足夠大時,在這些區間中,包含真值$\theta$的比例約為$1 - \alpha$.
對於每次抽樣進行區間估計時,置信區間就是一個概率分布函數中某兩個點之間的區域,例如例1中的$(\bar{X} - 2, \bar{X} + 2)$;置信水平就是這兩個點各自對x軸的垂線,以及x軸和密度函數所圍成的區域的面積(例如上例中的0.95)。置信區間越窄,精確度就越高(不確定性更小,結果更加精確),但此時置信區間可以圍成的面積就越小,所以置信水平就越小(即在多次抽樣中,區間估計的結果很難包含真值$\theta$,但是一旦包含,結果的范圍就可以限制在一個非常小的范圍)。假如反復抽樣10000次,且設定$\alpha = 0.1$,即置信水平為90%(置信水平限制了每次區間估計時的取值范圍),那么這10000個區間估計的結果中包含真值$\theta$的約為9000個。
2. 樞軸量
在小結"小結9-1 - 參數估計概述"中,對樞軸量的定義,以及樞軸量與統計量之間的差別作了簡單介紹。下面進一步介紹樞軸量法需要解決的問題以及樞軸量的構造和常見的樞軸量。
2.1 樞軸量法需要解決的問題
樞軸量法作為區間估計的主要方法,要求解的問題如下:
設總體$X$的分布含有未知參數$\theta$,$X_1, ..., X_n$是一次抽樣得到的樣本。
如何給出$\theta$的置信水平為$1 - \alpha$的雙側置信區間(或單側置信上限、單側置信下限)?
求解步驟:
(1) 找一個隨機變量$G$,該隨機變量需要滿足以下兩個條件:
- 分布已知;
- 是總體未知參數$\theta$和樣本$X_1, ..., X_n$的函數
(2) 找$a \lt b$,使$P(a \lt G \lt b) \geq 1 - \alpha$
(3) 從$a \lt G \lt b$解出$\hat{\theta}_L \lt \theta \lt \hat{\theta}_U$
$(\hat{\theta}_L, \hat{\theta}_U)$就是置信度為$1 - \alpha$的雙側置信區間。
邊界$a, b$的選擇
對於樞軸量$G$,滿足$P(a < G <b) \geq 1 - \alpha$的$a, b$可能有很多,這時可以參考下面的原則來進行選擇:
(1) 根據Neyman原則:求$a$和$b$使得區間長度最短;
(2) 如果最優解不存在或比較復雜,對連續總體,常取$a$和$b$滿足
$P(G(X_1, ..., X_n; \theta) \leq a) = P(G(X_1, ..., X_n; \theta) \geq b) = \alpha/2$
例題2
在點估計中有一個例子:為了估計4000名學生《微積分》課程的平均成績,隨機抽出了100名學生並用這100名同學的《微積分》課程的平均成績來估計4000名學生的平均成績,這就相當於完成了一次矩估計。
下面從區間估計的角度來解決這個問題:
從4000名學生中隨機選出100名,計算得到他們《微積分》課程的平均成績為72.3分,標准差為15.8分。假設全部學生的成績$X \sim N(\mu, \sigma^2)$, $\mu, \sigma$均未知,求$\mu$的置信水平為95%的雙側置信區間。
解:
對於正態總體$X \sim N(\mu, \sigma^2)$, $X_1, ..., X_n$是$X$的樣本,那么$\mu$的極大似然估計是$\bar{X}$,
$\bar{X} \sim N(\mu, \frac{\sigma^2}{n}), => \frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \sim N(0, 1)$
由於$\sigma$未知,不能取$\frac{\bar{X} - \mu}{\sigma/\sqrt{n}}$作為樞軸量!
用樣本方差代替總體方差可以得到,$\frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t(n - 1)$,$\frac{\bar{X} - \mu}{S/\sqrt{n}}$符合樞軸量的定義,可以作為本次估計的樞軸量。此時問題轉化成
求$a, b$,使得$P(a < \frac{\bar{X} - \mu}{S/\sqrt{n}} < b) = 0.95%$,且置信區間最短.
即:$\bar{X} - b \frac{S}{\sqrt{n}} < \mu < \bar{X} - a \frac{S}{\sqrt{n}}$
且$E(\bar{X} - a \frac{S}{\sqrt{n}}) - E(\bar{X} - b \sqrt{S}{\sqrt{n}}) = (b - a) \frac{E(S)}{\sqrt{n}} = min$
等價於在$P(a < \frac{\bar{X} - \mu}{S/\sqrt{n}} < b) = 0.95%$成立的$a, b$中$b-a = min$
由於t分布是對稱的,所以$b = -a = t_{0.0025}(99) \approx z_{0.0025} = 1.96$
由$\bar{x} = 72.3, s = 15.8$計算得,$\mu$的置信水平為95%的雙側置信區間為$(69.2, 75.4)$.
這一置信區間有95%的把握包含真值。
2.2 樞軸量的構造
樞軸量$G(X_1, ..., X_n; \theta)$的構造,通常從$\theta$的點估計$\hat{\theta}$(如極大似然估計,矩估計等)出發,根據$\theta$的分布(或包含$\theta$的函數的分布)進行改造而得。
2.3 常見樞軸量
從區間估計的求解流程和上面的例子可以看出來,如果要使用樞軸量法來作區間估計,找到合適的樞軸量是關鍵。在上面的例子中,由於總體的分布已知,因此對總體的均值$\mu$進行估計的時候,先用樣本均值$\bar{X}$來進行點估計,然后再使用樣本均值構造服從t分布的樞軸量來確定區間的邊界$a, b$.
- 下面所有的樞軸量都是跟總體均值和方差有關的,因此我們能估計的也僅限於這兩個參數;
- 總體方差已知和未知是兩種不同的情況,構造出來的樞軸量屬於不同的分布;
- 具有兩個正態總體時,可以估計兩個不同總體均值的差或方差的比值.
2.3.1 單個正態總體$N(\mu, \sigma^2)$情形
(1) $\mu$的樞軸量:
- $\sigma^2$已知時,$\frac{\bar{X} - \mu}{\sigma / \sqrt{n}} \sim N(0, 1)$
- $\sigma^2$未知時,$\frac{\bar{X} - \mu}{S / \sqrt{n}} \sim t(n - 1)$
(2) $\sigma^2$的樞軸量:
$\mu$未知,$\frac{(n-1) S^2}{\sigma^2} \sim \chi^2(n-1)$
2.3.2 二個正態總體$N(\mu_1, \sigma_1^2), N(\mu_2, \sigma_2^2)$的情形
(1) $\mu_1 - \mu_2$的樞軸量:
- $\sigma_1^2, \sigma_2^2$已知時,
$$\frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0, 1)$$
- $\sigma_1^2 = \sigma_2^2$未知時,
$$\frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{S_w \sqrt{1/n_1 + 1/n_2}} \sim t(n_1 + n_2 - 2)$$
其中$S_w^2 = \frac{(n_1 - 1)S_1^2 + (n_2 - 1)S_2^2}{n_1 + n_2 - 2}, S_w = \sqrt{S_w^2}$
(2) $\frac{\sigma_1^2}{\sigma_2^2}$的樞軸量
$\mu_1, \mu_2$未知
$$\frac{S_1^2 / S_2^2}{\sigma_1^2 / \sigma_2^2} \sim F(n_1 - 1, n_2 - 1)$$
2.3.3 其他總體均值的區間估計
設總體$X$的均值為$\mu$,方差為$\sigma^2$,非正態分布或不知分布形式. 樣本為$X_1, ..., X_n$.
當n充分大(一般$n > 30$)時,有中心極限定理知,$\bar{X} \sim N(\mu, \sigma^2/n)$,因此
$$\frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \sim N(0, 1)$$
以上分布為近似分布
當$\sigma^2$已知時,$\mu$的置信水平為$1 - \alpha$的近似置信區間為
$$(\bar{X} - z_{\alpha/2} \sigma / \sqrt{n}, \bar{X} + z_{\alpha/2} \sigma / \sqrt{n})$$
當$\sigma^2$未知時,以樣本方差$S^2$代入,得近似置信區間為
$$(\bar{X} - z_{\alpha/2} S / \sqrt{n}, \bar{X} + z_{\alpha/2} S / \sqrt{n})$$
3. 區間估計的類型
3.1 單個正態總體
單個正態總體均值的區間估計讓我們在一定樣本量的情況下,對總體的均值有一個大概的認識,並且這種認識是有一定保證的(置信度)。例如,我們可以通過隨機選取幾十個嬰兒,測量他們的體重,從而得知幾乎所有的嬰兒(比如95%的嬰兒)的體重大概在什么范圍。
3.1.1 總體均值$\mu$的置信區間
設總體$X \sim N(\mu, \sigma^2)$, $X_1, X_2, ..., X_n$為樣本. $\bar{X}$和$S^2$分別為樣本均值和樣本方差,置信水平為$1 - \alpha$.
(1) 總體方差$\sigma^2$已知時
$\bar{X}$是$\mu$的極大似然估計,取樞軸量$G = \frac{\bar{X} - \mu}{\sigma / \sqrt{n}} \sim N(0, 1)$
設常數$a < b$滿足:$P\{a < G < b\} \geq 1 - \alpha$
等價於 $P\{\bar{X} - \frac{\sigma}{\sqrt{n}} b < \mu < \bar{X} - \frac{\sigma}{\sqrt{n}} a\} \geq 1 - \alpha$ ($1 - \alpha$就是置信區間與概率密度函數和x軸圍成的面積)
由正態分布的對稱性可知,$a = -b = - z_{\alpha/2}$時,置信區間的長度$L$達到最短$L = 2 z_{\alpha/2} \frac{\sigma}{\sqrt{n}}$. 固定n,置信水平提高,即$(1 - \alpha)$增大,則$z_{\alpha/2}$增大,所有$L$變大,精確度降低;反之亦然。
所以$\mu$的雙側置信區間為:
$$(\bar{X} - \frac{\sigma}{\sqrt{n}} z_{\alpha/2}, \bar{X} + \frac{\sigma}{\sqrt{n}} z_{\alpha/2})$$
單側置信下限為:$\bar{X} - \frac{\sigma}{\sqrt{n}} z_{\alpha}$
單側置信上限為:$\bar{X} + \frac{\sigma}{\sqrt{n}} z_{\alpha}$
(2) 總體方差$\sigma^2$未知時
以樣本方差$S^2$估計$\sigma^2$,得樞軸量$G = \frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t(n-1)$
由$-t_{\alpha/2}(n-1) < G < t_{\alpha/2}(n-1)$解得,
$\bar{X} - \frac{S}{\sqrt{n}} t_{\alpha/2}(n-1) < \mu < \bar{X} + \frac{S}{\sqrt{n}} t_{\alpha/2}(n-1)$
所以$\mu$的置信區間為:
$$(\bar{X} - \frac{S}{\sqrt{n}} t_{\alpha/2}(n-1), \bar{X} + \frac{S}{\sqrt{n}} t_{\alpha/2}(n-1))$$
單側置信下限為:$\bar{X} - \frac{S}{\sqrt{n}} t_{\alpha}(n-1)$
單側置信上限為:$\bar{X} + \frac{S}{\sqrt{n}} t_{\alpha}(n-1)$
3.1.2 總體方差$\sigma^2$的置信區間($\mu$未知)
設總體$X \sim N(\mu, \sigma^2)$, $X_1, X_2, ..., X_n$為樣本. $\bar{X}$和$S^2$分別為樣本均值和樣本方差,置信水平為$1 - \alpha$.
由$\sigma^2$的估計$S^2$,得到樞軸量$\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$
由$\chi^2_{1-\alpha/2}(n-1) < \frac{(n-1)S^2}{\sigma^2} < \chi^2_{\alpha/2}(n-1)$
推出
$$\frac{(n-1)S^2}{\chi^2_{\alpha/2}(n-1)} < \alpha^2 < \frac{(n-1)S^2}{\chi^2_{1-\alpha/2}(n-1)}$$
因此雙側置信區間為:$(\frac{(n-1)S^2}{\chi^2_{\alpha/2}(n-1)}, \frac{(n-1)S^2}{\chi^2_{1 - \alpha/2}(n-1)})$
單側置信下限為:$\frac{(n-1)S^2}{\chi^2_{\alpha}(n-1)}$
單側置信上限為:$\frac{(n-1)S^2}{\chi^2_{1 - \alpha}(n-1)}$
例題2:
某種產品的壽命(單位:千小時)$X \sim N(\mu, \sigma^2)$,$\mu, \sigma^2$未知. 現隨機抽查10件產品進行壽命試驗,測得樣本均值$\bar{x} = 5.78$,樣本方差$s = 0.92$. 求$\mu$的置信水平為95%的單側置信下限.
解:由於總體方差未知,以樣本方差$S^2$估計$\sigma^2$,得樞軸量$G = \frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t(n-1)$
利用下面的方法計算t分布中$\alpha = 0.05$時,x的值,即$t_{\alpha}(n-1) = t_{0.05}(9)$的值
from scipy import stats stats.t.isf(0.05, 9)
結果為:
1.8331129326536337
所以$\mu$的置信水平為95%的單側置信下限為:
$\bar{x} - \frac{s}{\sqrt{10}} t_{0.05}(9) = 5.78 - \frac{0.92}{\sqrt{10}} \times 1.833 = 5.25$
更多關於上$\alpha$分位數的內容,可以參考"小結8 - 三大抽樣分布"中的第0小節(分位點/分位數)和第1.4小節(分位數的計算)
3.2 成對數據
這里的區間估計是指成對數據差的均值置信區間的估計
引例:為考察某種降壓葯的降壓效果,測試了n個高血壓病人在服葯前后的血壓(收縮壓)為
$$(X_1, Y_1), ..., (X_n, Y_n).$$
由於個人體質的差異,$X_1, ..., X_n$不能看成來自同一個正態總體的樣本,即$X_1, ..., X_n$是相互獨立但不同分布的樣本,$Y_1, ..., Y_n$也是. 另外對同一個個體,$X_i$和$Y_i$也是不獨立的.
作差值$D_i = X_i - Y_i, i = 1, ..., n$,則取消了個體差異,僅與降壓葯的作用有關,因此可以將$D_1, ..., D_n$看成來自同一個正態總體$N(\mu_D, \sigma^2_D)$的樣本,且相互獨立.
由此可得,$\mu_D$的置信水平為$1-\alpha$的置信區間為:
$$(\bar{D} - t_{\alpha/2}(n-1)\frac{S_D}{\sqrt{n}}, \bar{D} + t_{\alpha/2}(n-1)\frac{S_D}{\sqrt{n}})$$
其中$\bar{D} = \bar{X} - \bar{Y}, S_D = \sqrt{\frac{1}{n-1} \sum_{ i = 1 }^{ n } (D_i - \bar{D})^2}$
3.3 兩個正態總體
設樣本$(X_1, ..., X_{n_1})$和$(Y_1, ..., Y_{n_2})$分別來自總體$N(\mu_1, \sigma^2)$和$N(\mu, \sigma^2)$,並且它們相互獨立. 樣本均值分別為$\bar{X}, \bar{Y}$;樣本方差分別為$S_1^2, S_2^2$. 置信水平為$1-\alpha$.
3.3.1 兩個均值差$(\mu_1 - \mu_2)$的置信區間
(1) $\sigma_1^2, \sigma_2^2$已知時
由$\mu_1 - \mu_2$的估計$\bar{X} - \bar{Y}$的分布,得樞軸量:
$$\frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0, 1)$$
得置信區間:$((\bar{X} - \bar{Y}) - z_{\alpha/2} \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}, (\bar{X} - \bar{Y}) + z_{\alpha/2} \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}})$
(2) $\sigma_1^2 = \sigma_2^2$未知
以$S_w^2 = \frac{(n_1 - 1) S_1^2 + (n_2 - 1) S_2^2}{n_1 + n_2 - 2}$代替$\sigma^2$得樞軸量:
$$\frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 - 2)$$
置信區間為:$((\bar{X} - \bar{Y}) - t_{\alpha/2}(n_1 + n_2 - 2) S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}, (\bar{X} - \bar{Y}) + t_{\alpha/2}(n_1 + n_2 - 2) S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}})$
(3) $\sigma_1^2 \neq \sigma_2^2$且未知
以$S_1^2$估計$\sigma_1^2$,以$S_2^2$估計$\sigma_2^2$
- 當樣本量$n_1$和$n_2$都充分大時(一般要>30),
$$\frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{\sqrt{\frac{S_1^2}{n_1} + \frac{S_2^2}{n_2}}} \sim N(0, 1)$$
以上為近似分布,得近似置信區間為:$((\bar{X} - \bar{Y}) - z_{\alpha/2} \sqrt{\frac{S_1^2}{n_1} + \frac{S_2^2}{n_2}}, (\bar{X} - \bar{Y}) + z_{\alpha/2} \sqrt{\frac{S_1^2}{n_1} + \frac{S_2^2}{n_2}})$
- 當樣本量較小時,
$$\frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{\sqrt{\frac{S_1^2}{n_1} + \frac{S_2^2}{n_2}}} \sim t(k),$$
以上為近似分布,其中$k \approx min(n_1 - 1, n_2 - 1)$,得近似置信區間為:
$((\bar{X} - \bar{Y}) - t_{\alpha/2}(k) \sqrt{\frac{S_1^2}{n_1} + \frac{S_2^2}{n_2}}, (\bar{X} - \bar{Y}) + t_{\alpha/2}(k) \sqrt{\frac{S_1^2}{n_1} + \frac{S_2^2}{n_2}})$
3.3.2 方差之比$\frac{\sigma_1^2}{\sigma_2^2}$的置信區間($\mu_1, \mu_2$未知)
由$\frac{\sigma_1^2}{\sigma_2^2}$的估計$\frac{S_1^2}{S_2^2}$得到樞軸量
$$\frac{S_1^2 / S_2^2}{\sigma_1^2 / \sigma_2^2} \sim F(n_1 - 1, n_2 - 1)$$
由$F_{1 - \frac{\alpha}{2}}(n_1 - 1, n_2 - 1) < \frac{S_1^2 / S_2^2}{\sigma_1^2 / \sigma_2^2} < F_{\frac{\alpha}{2}}(n_1 - 1, n_2 - 1)$
得$\frac{S_1^2}{S_2^2} \frac{1}{F_{\frac{\alpha}{2}}(n_1 - 1, n_2 - 1)} < \frac{\sigma_1^2}{\sigma_2^2} < \frac{S_1^2}{S_2^2} \frac{1}{F_{1 - \frac{\alpha}{2}}(n_1 - 1, n_2 - 1) }$
置信區間為:
$$(\frac{S_1^2}{S_2^2} \frac{1}{F_{\frac{\alpha}{2}}(n_1 - 1, n_2 - 1)}, \frac{S_1^2}{S_2^2} \frac{1}{F_{1 - \frac{\alpha}{2}}(n_1 - 1, n_2 - 1) })$$
歡迎閱讀“概率論與數理統計及Python實現”系列文章
Reference
中國大學MOOC:浙江大學,概率論與數理統計