樞軸量法、分位數


Part 1:樞軸量法

樞軸變量法是基於點估計量的。我們知道,統計量是樣本的函數,這意味着統計量中不能含有未知參數,而參數的點估計量是用統計量的觀測值作為待估參數的估計值,其分布一定含有待估參數,樞軸量法的思想就是,通過一定的變換,讓點估計的函數的分布不含待估參數,進而基於分布來構造區間估計。

舉一個簡單的例子,對於正態總體N(μ,4)N(μ,4),顯然X¯N(μ,4/n)X¯∼N(μ,4/n),這里X¯的分布含有未知參數μμ。構造其樞軸量,就是找到一個函數變換,使得新的隨機變量分布不含未知參數。注意,這里用了隨機變量這個詞而不是統計量,意味着樞軸量不是統計量,即不能由樣本觀測值計算出,這是因為雖然樞軸量的分布不含未知參數,但是樞軸量的表現形式含有未知參數。顯然,這里

 

X¯μN(0,4n),X¯−μ∼N(0,4n),

 

這樣,X¯μX¯−μ的分布已知,自然容易找到一個常數區間[c,d][c,d],使得這個區間有1α1−α的概率包含X¯μX¯−μ的觀測值,雖然此時我們不知道區間的端點是多少,但至少知道端點可以是固定的數c,dc,d。對樞軸量使用不等式變換,即X¯μ[c,d]μ[X¯d,X¯c]X¯−μ∈[c,d]⇒μ∈[X¯−d,X¯−c],得到置信水平為1α1−α的置信區間。這就是樞軸量法的操作步驟。

不同分布族的參數對於總體的意義是不同的。像正態分布N(μ,σ2)N(μ,σ2)的均值μμ,均勻分布U(a,a+r)U(a,a+r)的起點aa這種參數主要影響觀測值的大小,可以直接通過XμX−μXaX−a的手段消除,這種參數稱為位置參數;正態分布N(μ,σ2)N(μ,σ2)的標准差σσ,指數分布E(λ)E(λ)的速率λλ這種參數主要影響觀測值的離散程度,可以通過X/σX/σλXλX之類的手段消除,這種參數稱為尺度參數。面對不同的參數,往往有不同的方式構造樞軸量,應當結合其特點選擇構造方式。

接下來,我們將樞軸量法運用到一些具體實例中,體會樞軸量法的實際應用。

Part 2:分位數

在開始樞軸量法的實際應用前,先介紹分位數這一概念,這為我們確定置信區間提供了有力武器。現在,我們先給出分位數的定義(如果不特別說明,都指總體分位數而非樣本分位數)。分位數可以分為下分位數和上分位數,一般稱下分位數為分位數,但我們更常用的是上分位數。

對於某個分布FFXFX∼FFF(下)αα分位數指的是這樣一個點xα,滿足

 

P(Xxα)=α,P(X≤xα)=α,

 

如果FF有反函數F1(x)F−1(x),則有xα=F1(α)xα=F−1(α)

對於某個分布FFXFX∼FFFαα分位數指的是這樣一個點yα,滿足

 

P(Xyα)=α.P(X≥yα)=α.

 

換言之,如果分布函數FF存在反函數F1(x)F−1(x),則FF的上αα分位數是yα=F1(1α)yα=F−1(1−α)

image-20210216205652211

也許結合圖形會更好理解。對於上面的圖形,如果這是一個密度函數,黑色部分的面積為0.050.05,那么紅色的點就是該分布的上0.050.05分位數,同時也是其下0.950.95分位數。

顯然,對於一個完全確定的分布,其各分位數都是完全確定的,是常數。分布多種多樣,不可能對所有分布都詳細地討論其分位數,但是對一些常用分布,其各分位數的數值已經被制成表,這包括標准正態分布,與正態分布的三大衍生分布——χ2χ2分布、tt分布、FF分布。

今后,我們將使用uαχ2α(n)χα2(n)tα(n)tα(n)Fα(m,n)Fα(m,n),分別代表標准正態分布、自由度為nnχ2χ2分布、自由度為nntt分布、自由度為m,nm,nFF分布的αα分位數,給定分布類型、分位、自由度后,這些值都可以通過查閱分位數表得到。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM