Part 1:樞軸量法
樞軸變量法是基於點估計量的。我們知道,統計量是樣本的函數,這意味着統計量中不能含有未知參數,而參數的點估計量是用統計量的觀測值作為待估參數的估計值,其分布一定含有待估參數,樞軸量法的思想就是,通過一定的變換,讓點估計的函數的分布不含待估參數,進而基於分布來構造區間估計。
舉一個簡單的例子,對於正態總體N(μ,4)N(μ,4),顯然X¯∼N(μ,4/n)X¯∼N(μ,4/n),這里X¯X¯的分布含有未知參數μμ。構造其樞軸量,就是找到一個函數變換,使得新的隨機變量分布不含未知參數。注意,這里用了隨機變量這個詞而不是統計量,意味着樞軸量不是統計量,即不能由樣本觀測值計算出,這是因為雖然樞軸量的分布不含未知參數,但是樞軸量的表現形式含有未知參數。顯然,這里
這樣,X¯−μX¯−μ的分布已知,自然容易找到一個常數區間[c,d][c,d],使得這個區間有1−α1−α的概率包含X¯−μX¯−μ的觀測值,雖然此時我們不知道區間的端點是多少,但至少知道端點可以是固定的數c,dc,d。對樞軸量使用不等式變換,即X¯−μ∈[c,d]⇒μ∈[X¯−d,X¯−c]X¯−μ∈[c,d]⇒μ∈[X¯−d,X¯−c],得到置信水平為1−α1−α的置信區間。這就是樞軸量法的操作步驟。
不同分布族的參數對於總體的意義是不同的。像正態分布N(μ,σ2)N(μ,σ2)的均值μμ,均勻分布U(a,a+r)U(a,a+r)的起點aa這種參數主要影響觀測值的大小,可以直接通過X−μX−μ,X−aX−a的手段消除,這種參數稱為位置參數;正態分布N(μ,σ2)N(μ,σ2)的標准差σσ,指數分布E(λ)E(λ)的速率λλ這種參數主要影響觀測值的離散程度,可以通過X/σX/σ,λXλX之類的手段消除,這種參數稱為尺度參數。面對不同的參數,往往有不同的方式構造樞軸量,應當結合其特點選擇構造方式。
接下來,我們將樞軸量法運用到一些具體實例中,體會樞軸量法的實際應用。
Part 2:分位數
在開始樞軸量法的實際應用前,先介紹分位數這一概念,這為我們確定置信區間提供了有力武器。現在,我們先給出分位數的定義(如果不特別說明,都指總體分位數而非樣本分位數)。分位數可以分為下分位數和上分位數,一般稱下分位數為分位數,但我們更常用的是上分位數。
對於某個分布FF,X∼FX∼F,FF的(下)αα分位數指的是這樣一個點xαxα,滿足
如果FF有反函數F−1(x)F−1(x),則有xα=F−1(α)xα=F−1(α)。
對於某個分布FF,X∼FX∼F,FF的上αα分位數指的是這樣一個點yαyα,滿足
換言之,如果分布函數FF存在反函數F−1(x)F−1(x),則FF的上αα分位數是yα=F−1(1−α)yα=F−1(1−α)。
也許結合圖形會更好理解。對於上面的圖形,如果這是一個密度函數,黑色部分的面積為0.050.05,那么紅色的點就是該分布的上0.050.05分位數,同時也是其下0.950.95分位數。
顯然,對於一個完全確定的分布,其各分位數都是完全確定的,是常數。分布多種多樣,不可能對所有分布都詳細地討論其分位數,但是對一些常用分布,其各分位數的數值已經被制成表,這包括標准正態分布,與正態分布的三大衍生分布——χ2χ2分布、tt分布、FF分布。
今后,我們將使用uαuα、χ2α(n)χα2(n)、tα(n)tα(n)、Fα(m,n)Fα(m,n),分別代表標准正態分布、自由度為nn的χ2χ2分布、自由度為nn的tt分布、自由度為m,nm,n的FF分布的上αα分位數,給定分布類型、分位、自由度后,這些值都可以通過查閱分位數表得到。