學生t-分布(Student's t-distribution),可簡稱為t分布。
關於t 分布的早期理論工作,是英國統計學家威廉•西利•戈塞特(WillamSealy Gosset)在1900年進行的。
應用在估計呈正態分布的母群體之平均數。 t分布是小樣本分布,t分布適用於當總體標准差R未知時用樣本標准差s代替總體標准差R,由樣本平均數推斷總體平均數。它是對兩個樣本均值差異進行顯著性測試的學生t檢定的基礎。學生t檢定改進了Z檢定,因為Z檢定以母體標准差已知為前提。雖然在樣本數量大(超過30個)時,可以應用Z檢定來求得近似值,但Z檢定用在小樣本會產生很大的誤差,因此必須改用學生t檢定以求准確。
在母體標准差未知的情況下,不論樣本數量大或小皆可應用學生t檢定。在待比較的數據有三組以上時,因為誤差無法壓低,此時可以用變異數分析(ANOVA)代替學生t檢定。
為樣本均值。
為樣本方差的無偏估計量. V可以被定義為
其中有一個自由度為n − 1的卡方分布(由 Cochran定理得知),Z可以被定義為
Z呈正態分布並且均值和方差分別為0和1。它的樣本方差
也是一個服從均值 μ和方差σ2/n的正態分布, 其中Z和V是相互獨立的
也是一個服從均值 μ和方差σ2/n的正態分布, 其中Z和V是相互獨立的
T和Z不同的是實際的標准差σ被隨機變量Sn取代,我們注意到未知總體方差 σ2在T中沒有出現,因為分子和分母都有一個σ,所以他們抵消了。
聯合密度函數
因為Z,V是相互獨立的,所以它們的聯合密度函數為各自的密度函數的乘積。
(1) Z
(-∞ < u < +∞)
(2) V
(0 ≤ v < +∞)
我們記 p(u, x)為它們的聯合概率密度函數,然后有
(1)
t分布的分布函數
令F(t)為T的累積分布函數,根據分布函數的定義,F(t)是T小於等於t的概率:
根據多變量分布函數的定義,這個概率等同於變量U和X在限制區域上的聯合概率密度函數
p
(
u, x
)的雙重積分,且積分區域為限制條件
u
≤ (
x/n
)
1/2
.
t
下的區域,這個區域就是下圖藍色曲線以下的區域
把(1)代入上式有
T的密度函數
這個復雜的積分無法寫成閉式的形式,幸運的是我們不需要算它的積分,我們只需要它對t的導數。那么先讓我們看看F(t)的結構
F(t)能夠被寫成如下形式:
令
現在對F微分,我們便得到:
令
這個積分是關於t的函數,通過鏈式法則:
如果h(g(t))
如果h(g(t))
第一項為
我們將g(t)代入u得:
第二項是
最終得到:
將這幾項相結合便得到:
再令y = (1 + t²/n)x
然后我們得到
積分項正好是Gamma函數
合並入整個式子得到t的分布函數,並且自由度是n:
下面是幾種特殊的情況:
n = 1, 柯西分布
n=2
n=3
關於n = ∞,下面要進行詳細的解釋:
函數項
當n趨向於無窮時,
為無窮小項,而對於log(1 + x)的taylor展開有:
為無窮小項,而對於log(1 + x)的taylor展開有:
![log[{\left( {1{\rm{ }} + \frac{{{x^2}}}{n}} \right)^{\frac{{n + 1}}{2}}}]](/image/aHR0cDovL2NoYXJ0LmFwaXMuZ29vZ2xlLmNvbS9jaGFydD9jaHQ9dHgmY2hzPTF4MCZjaGY9YmcscyxGRkZGRkYwMCZjaGNvPTAwMDAwMCZjaGw9bG9nJTVCJTdCJTVDbGVmdCUyOCUyMCU3QjElN0IlNUNybSU3QiUyMCU3RCU3RCUyMCUyQiUyMCU1Q2ZyYWMlN0IlN0IlN0J4JTVFMiU3RCU3RCU3RCU3Qm4lN0QlN0QlMjAlNUNyaWdodCUyOSU1RSU3QiU1Q2ZyYWMlN0IlN0JuJTIwJTJCJTIwMSU3RCU3RCU3QjIlN0QlN0QlN0QlNUQ=.png)
所以
現在再回頭看看t分布的系數。
情況1: n為偶數,設n = 2p;
根據Stirling公式: n! ~ n n e- n(2πn) 1/2 有
(2p )! ~ (2p)2pe -2p(2π.2p) 1/2
(p !)² ~ (p p )2(e-p) 2.2π p
將此代入到C2 p有
情況2: n為奇數,設n = 2p+1;
(2p )! ~ (2p) 2pe - 2p (2π.2p) 1/2
(p !)² ~ (p p )2( e-p) 2.2π p
將此代入到C2 p有
所以,當n趨向於無窮時有:
方差的求解:
方法一:直接方法
其中
令
其中
,
首先計算
,
,
令 x²/ n = tan²θ
同樣算得:
這種類型的積分叫做Wallis積分。
現在讓我們計算它的通用表達方式:
再令
u' = cos n - 2 (θ)sin(θ)
v = sin( θ)
利用下式:
有
因此可以得到Wn = Wn - 2 + Wn / (n - 1)
Wallis積分是一個遞歸表達式,n為偶數或者奇數時分別取不同的結果
當n為偶數時
當n為奇數時
由於Var( Tn ) = C n I n, 分別將C n和 I n代入式中,最終得到的方差為
方法二: LOTUS
根據定義
設x = 2y 然后得到dx = 2dy

,
)。 令: