学生t-分布(Student's t-distribution),可简称为t分布。
关于t 分布的早期理论工作,是英国统计学家威廉•西利•戈塞特(WillamSealy Gosset)在1900年进行的。
应用在估计呈正态分布的母群体之平均数。 t分布是小样本分布,t分布适用于当总体标准差R未知时用样本标准差s代替总体标准差R,由样本平均数推断总体平均数。它是对两个样本均值差异进行显著性测试的学生t检定的基础。学生t检定改进了Z检定,因为Z检定以母体标准差已知为前提。虽然在样本数量大(超过30个)时,可以应用Z检定来求得近似值,但Z检定用在小样本会产生很大的误差,因此必须改用学生t检定以求准确。
在母体标准差未知的情况下,不论样本数量大或小皆可应用学生t检定。在待比较的数据有三组以上时,因为误差无法压低,此时可以用变异数分析(ANOVA)代替学生t检定。

为样本均值。

为样本方差的无偏估计量. V可以被定义为

其中有一个自由度为n − 1的卡方分布(由 Cochran定理得知),Z可以被定义为

Z呈正态分布并且均值和方差分别为0和1。它的样本方差
也是一个服从均值 μ和方差σ2/n的正态分布, 其中Z和V是相互独立的


T和Z不同的是实际的标准差σ被随机变量Sn取代,我们注意到未知总体方差 σ2在T中没有出现,因为分子和分母都有一个σ,所以他们抵消了。
联合密度函数
因为Z,V是相互独立的,所以它们的联合密度函数为各自的密度函数的乘积。
(1) Z

(2) V

我们记 p(u, x)为它们的联合概率密度函数,然后有

t分布的分布函数
令F(t)为T的累积分布函数,根据分布函数的定义,F(t)是T小于等于t的概率:

根据多变量分布函数的定义,这个概率等同于变量U和X在限制区域上的联合概率密度函数
p
(
u, x
)的双重积分,且积分区域为限制条件
u
≤ (
x/n
)
1/2
.
t
下的区域,这个区域就是下图蓝色曲线以下的区域


把(1)代入上式有


T的密度函数
这个复杂的积分无法写成闭式的形式,幸运的是我们不需要算它的积分,我们只需要它对t的导数。那么先让我们看看F(t)的结构
F(t)能够被写成如下形式:
令

![F(t) = K.\int_0^\infty {[\int_{ - \infty }^{g(t)} {h(u).du]l(x).dx} }](/image/aHR0cDovL2NoYXJ0LmFwaXMuZ29vZ2xlLmNvbS9jaGFydD9jaHQ9dHgmY2hzPTF4MCZjaGY9YmcscyxGRkZGRkYwMCZjaGNvPTAwMDAwMCZjaGw9RiUyOHQlMjklMjAlM0QlMjBLLiU1Q2ludF8wJTVFJTVDaW5mdHklMjAlMjAlN0IlNUIlNUNpbnRfJTdCJTIwLSUyMCU1Q2luZnR5JTIwJTdEJTVFJTdCZyUyOHQlMjklN0QlMjAlN0JoJTI4dSUyOS5kdSU1RGwlMjh4JTI5LmR4JTdEJTIwJTdEJTIw.png)
现在对F微分,我们便得到:
![F'(t) = K.\int_0^\infty {[\frac{d}{{dt}}\int_{ - \infty }^{g(t)} {h(u).du]l(x).dx} }](/image/aHR0cDovL2NoYXJ0LmFwaXMuZ29vZ2xlLmNvbS9jaGFydD9jaHQ9dHgmY2hzPTF4MCZjaGY9YmcscyxGRkZGRkYwMCZjaGNvPTAwMDAwMCZjaGw9RiUyNyUyOHQlMjklMjAlM0QlMjBLLiU1Q2ludF8wJTVFJTVDaW5mdHklMjAlMjAlN0IlNUIlNUNmcmFjJTdCZCU3RCU3QiU3QmR0JTdEJTdEJTVDaW50XyU3QiUyMC0lMjAlNUNpbmZ0eSUyMCU3RCU1RSU3QmclMjh0JTI5JTdEJTIwJTdCaCUyOHUlMjkuZHUlNURsJTI4eCUyOS5keCU3RCUyMCU3RCUyMA==.png)
令

这个积分是关于t的函数,通过链式法则:
如果h(g(t))
如果h(g(t))


第一项为

我们将g(t)代入u得:

第二项是

最终得到:

将这几项相结合便得到:

再令y = (1 + t²/n)x

然后我们得到
![{f_n}(t) = \frac{1}{{\sqrt {n\pi } \Gamma (\frac{n}{2})}}[\frac{1}{{{{(1 + \frac{{{t^2}}}{n})}^{(n + 1)/2}}}}]\int_0^\infty {\frac{{{y^{(n + 1)/2 - 1}}{e^{ - \frac{y}{2}}}}}{{{2^{(n + 1)/2}}}}dy}](/image/aHR0cDovL2NoYXJ0LmFwaXMuZ29vZ2xlLmNvbS9jaGFydD9jaHQ9dHgmY2hzPTF4MCZjaGY9YmcscyxGRkZGRkYwMCZjaGNvPTAwMDAwMCZjaGw9JTdCZl9uJTdEJTI4dCUyOSUyMCUzRCUyMCU1Q2ZyYWMlN0IxJTdEJTdCJTdCJTVDc3FydCUyMCU3Qm4lNUNwaSUyMCU3RCUyMCU1Q0dhbW1hJTIwJTI4JTVDZnJhYyU3Qm4lN0QlN0IyJTdEJTI5JTdEJTdEJTVCJTVDZnJhYyU3QjElN0QlN0IlN0IlN0IlN0IlMjgxJTIwJTJCJTIwJTVDZnJhYyU3QiU3QiU3QnQlNUUyJTdEJTdEJTdEJTdCbiU3RCUyOSU3RCU1RSU3QiUyOG4lMjAlMkIlMjAxJTI5JTJGMiU3RCU3RCU3RCU3RCU1RCU1Q2ludF8wJTVFJTVDaW5mdHklMjAlMjAlN0IlNUNmcmFjJTdCJTdCJTdCeSU1RSU3QiUyOG4lMjAlMkIlMjAxJTI5JTJGMiUyMC0lMjAxJTdEJTdEJTdCZSU1RSU3QiUyMC0lMjAlNUNmcmFjJTdCeSU3RCU3QjIlN0QlN0QlN0QlN0QlN0QlN0IlN0IlN0IyJTVFJTdCJTI4biUyMCUyQiUyMDElMjklMkYyJTdEJTdEJTdEJTdEZHklN0QlMjA=.png)
积分项正好是Gamma函数

合并入整个式子得到t的分布函数,并且自由度是n:
![{f_n}(t) = \frac{{\Gamma (\frac{{n + 1}}{2})}}{{\sqrt {n\pi } \Gamma (\frac{n}{2})}}[{(1 + \frac{{{t^2}}}{n})^{ - (n + 1)/2}}]](/image/aHR0cDovL2NoYXJ0LmFwaXMuZ29vZ2xlLmNvbS9jaGFydD9jaHQ9dHgmY2hzPTF4MCZjaGY9YmcscyxGRkZGRkYwMCZjaGNvPTAwMDAwMCZjaGw9JTdCZl9uJTdEJTI4dCUyOSUyMCUzRCUyMCU1Q2ZyYWMlN0IlN0IlNUNHYW1tYSUyMCUyOCU1Q2ZyYWMlN0IlN0JuJTIwJTJCJTIwMSU3RCU3RCU3QjIlN0QlMjklN0QlN0QlN0IlN0IlNUNzcXJ0JTIwJTdCbiU1Q3BpJTIwJTdEJTIwJTVDR2FtbWElMjAlMjglNUNmcmFjJTdCbiU3RCU3QjIlN0QlMjklN0QlN0QlNUIlN0IlMjgxJTIwJTJCJTIwJTVDZnJhYyU3QiU3QiU3QnQlNUUyJTdEJTdEJTdEJTdCbiU3RCUyOSU1RSU3QiUyMC0lMjAlMjhuJTIwJTJCJTIwMSUyOSUyRjIlN0QlN0QlNUQ=.png)
下面是几种特殊的情况:
n = 1, 柯西分布

n=2

n=3

关于n = ∞,下面要进行详细的解释:
函数项
![[{(1 + \frac{{{t^2}}}{n})^{ - (n + 1)/2}}]](/image/aHR0cDovL2NoYXJ0LmFwaXMuZ29vZ2xlLmNvbS9jaGFydD9jaHQ9dHgmY2hzPTF4MCZjaGY9YmcscyxGRkZGRkYwMCZjaGNvPTAwMDAwMCZjaGw9JTVCJTdCJTI4MSUyMCUyQiUyMCU1Q2ZyYWMlN0IlN0IlN0J0JTVFMiU3RCU3RCU3RCU3Qm4lN0QlMjklNUUlN0IlMjAtJTIwJTI4biUyMCUyQiUyMDElMjklMkYyJTdEJTdEJTVE.png)
当n趋向于无穷时,
为无穷小项,而对于log(1 + x)的taylor展开有:


![log[{\left( {1{\rm{ }} + \frac{{{x^2}}}{n}} \right)^{\frac{{n + 1}}{2}}}]](/image/aHR0cDovL2NoYXJ0LmFwaXMuZ29vZ2xlLmNvbS9jaGFydD9jaHQ9dHgmY2hzPTF4MCZjaGY9YmcscyxGRkZGRkYwMCZjaGNvPTAwMDAwMCZjaGw9bG9nJTVCJTdCJTVDbGVmdCUyOCUyMCU3QjElN0IlNUNybSU3QiUyMCU3RCU3RCUyMCUyQiUyMCU1Q2ZyYWMlN0IlN0IlN0J4JTVFMiU3RCU3RCU3RCU3Qm4lN0QlN0QlMjAlNUNyaWdodCUyOSU1RSU3QiU1Q2ZyYWMlN0IlN0JuJTIwJTJCJTIwMSU3RCU3RCU3QjIlN0QlN0QlN0QlNUQ=.png)

![{\lim }\limits_{n \to \infty } log[{\left( {1{\rm{ }} + \frac{{{x^2}}}{n}} \right)^{\frac{{n + 1}}{2}}}] = {\lim }\limits_{n \to \infty } \frac{{(n + 1){x^2}}}{{2n}} = \frac{{{x^2}}}{2}](/image/aHR0cDovL2NoYXJ0LmFwaXMuZ29vZ2xlLmNvbS9jaGFydD9jaHQ9dHgmY2hzPTF4MCZjaGY9YmcscyxGRkZGRkYwMCZjaGNvPTAwMDAwMCZjaGw9JTIwJTdCJTVDbGltJTIwJTdEJTVDbGltaXRzXyU3Qm4lMjAlNUN0byUyMCU1Q2luZnR5JTIwJTdEJTIwbG9nJTVCJTdCJTVDbGVmdCUyOCUyMCU3QjElN0IlNUNybSU3QiUyMCU3RCU3RCUyMCUyQiUyMCU1Q2ZyYWMlN0IlN0IlN0J4JTVFMiU3RCU3RCU3RCU3Qm4lN0QlN0QlMjAlNUNyaWdodCUyOSU1RSU3QiU1Q2ZyYWMlN0IlN0JuJTIwJTJCJTIwMSU3RCU3RCU3QjIlN0QlN0QlN0QlNUQlMjAlM0QlMjAlMjAlN0IlNUNsaW0lMjAlN0QlNUNsaW1pdHNfJTdCbiUyMCU1Q3RvJTIwJTVDaW5mdHklMjAlN0QlMjAlNUNmcmFjJTdCJTdCJTI4biUyMCUyQiUyMDElMjklN0J4JTVFMiU3RCU3RCU3RCU3QiU3QjJuJTdEJTdEJTIwJTNEJTIwJTVDZnJhYyU3QiU3QiU3QnglNUUyJTdEJTdEJTdEJTdCMiU3RA==.png)
所以

现在再回头看看t分布的系数。
情况1: n为偶数,设n = 2p;

根据Stirling公式: n! ~ n n e- n(2πn) 1/2 有
(2p )! ~ (2p)2pe -2p(2π.2p) 1/2
(p !)² ~ (p p )2(e-p) 2.2π p
将此代入到C2 p有

情况2: n为奇数,设n = 2p+1;

(2p )! ~ (2p) 2pe - 2p (2π.2p) 1/2
(p !)² ~ (p p )2( e-p) 2.2π p
将此代入到C2 p有

所以,当n趋向于无穷时有:

方差的求解:
方法一:直接方法
![E[{X^2}] = \int\limits_{ - \infty }^\infty {{x^2}p(x)dx = {C_n}\int\limits_0^\infty {\frac{{{x^2}}}{{{{(1 + \frac{{{x^2}}}{n})}^{(n + 1)/2}}}}} } dx](/image/aHR0cDovL2NoYXJ0LmFwaXMuZ29vZ2xlLmNvbS9jaGFydD9jaHQ9dHgmY2hzPTF4MCZjaGY9YmcscyxGRkZGRkYwMCZjaGNvPTAwMDAwMCZjaGw9RSU1QiU3QlglNUUyJTdEJTVEJTIwJTNEJTIwJTVDaW50JTVDbGltaXRzXyU3QiUyMC0lMjAlNUNpbmZ0eSUyMCU3RCU1RSU1Q2luZnR5JTIwJTIwJTdCJTdCeCU1RTIlN0RwJTI4eCUyOWR4JTIwJTNEJTIwJTdCQ19uJTdEJTVDaW50JTVDbGltaXRzXzAlNUUlNUNpbmZ0eSUyMCUyMCU3QiU1Q2ZyYWMlN0IlN0IlN0J4JTVFMiU3RCU3RCU3RCU3QiU3QiU3QiU3QiUyODElMjAlMkIlMjAlNUNmcmFjJTdCJTdCJTdCeCU1RTIlN0QlN0QlN0QlN0JuJTdEJTI5JTdEJTVFJTdCJTI4biUyMCUyQiUyMDElMjklMkYyJTdEJTdEJTdEJTdEJTdEJTIwJTdEJTIwZHg=.png)
其中

令


其中


首先计算
,

令 x²/ n = tan²θ


同样算得:

这种类型的积分叫做Wallis积分。
现在让我们计算它的通用表达方式:

![= \int\limits_0^{\pi /2} {{{\cos }^{n - 2}}(\theta )} {\cos ^2}(\theta )d\theta = \int\limits_0^{\pi /2} {{{\cos }^{n - 2}}(\theta )} [1 - {\sin ^2}(\theta )]d\theta](/image/aHR0cDovL2NoYXJ0LmFwaXMuZ29vZ2xlLmNvbS9jaGFydD9jaHQ9dHgmY2hzPTF4MCZjaGY9YmcscyxGRkZGRkYwMCZjaGNvPTAwMDAwMCZjaGw9JTIwJTNEJTIwJTVDaW50JTVDbGltaXRzXzAlNUUlN0IlNUNwaSUyMCUyRjIlN0QlMjAlN0IlN0IlN0IlNUNjb3MlMjAlN0QlNUUlN0JuJTIwLSUyMDIlN0QlN0QlMjglNUN0aGV0YSUyMCUyOSU3RCUyMCU3QiU1Q2NvcyUyMCU1RTIlN0QlMjglNUN0aGV0YSUyMCUyOWQlNUN0aGV0YSUyMCUyMCUzRCUyMCU1Q2ludCU1Q2xpbWl0c18wJTVFJTdCJTVDcGklMjAlMkYyJTdEJTIwJTdCJTdCJTdCJTVDY29zJTIwJTdEJTVFJTdCbiUyMC0lMjAyJTdEJTdEJTI4JTVDdGhldGElMjAlMjklN0QlMjAlNUIxJTIwLSUyMCU3QiU1Q3NpbiUyMCU1RTIlN0QlMjglNUN0aGV0YSUyMCUyOSU1RGQlNUN0aGV0YSUyMA==.png)


再令
u' = cos n - 2 (θ)sin(θ)
v = sin( θ)
利用下式:
![\int\limits_0^{\pi /2} {u'v} d\theta = [uv]_0^{\pi /2} - \int\limits_0^{\pi /2} {uv'} d\theta](/image/aHR0cDovL2NoYXJ0LmFwaXMuZ29vZ2xlLmNvbS9jaGFydD9jaHQ9dHgmY2hzPTF4MCZjaGY9YmcscyxGRkZGRkYwMCZjaGNvPTAwMDAwMCZjaGw9JTVDaW50JTVDbGltaXRzXzAlNUUlN0IlNUNwaSUyMCUyRjIlN0QlMjAlN0J1JTI3diU3RCUyMGQlNUN0aGV0YSUyMCUyMCUzRCUyMCU1QnV2JTVEXzAlNUUlN0IlNUNwaSUyMCUyRjIlN0QlMjAtJTIwJTVDaW50JTVDbGltaXRzXzAlNUUlN0IlNUNwaSUyMCUyRjIlN0QlMjAlN0J1diUyNyU3RCUyMGQlNUN0aGV0YSUyMA==.png)

![= [ - \frac{{{{\cos }^{n - 1}}(\theta )sin(\theta )}}{{n - 1}}]_0^{\pi /2} + \frac{1}{{n - 1}}\int\limits_0^{\pi /2} {{{\cos }^n}(\theta )} d\theta](/image/aHR0cDovL2NoYXJ0LmFwaXMuZ29vZ2xlLmNvbS9jaGFydD9jaHQ9dHgmY2hzPTF4MCZjaGY9YmcscyxGRkZGRkYwMCZjaGNvPTAwMDAwMCZjaGw9JTIwJTNEJTIwJTVCJTIwLSUyMCU1Q2ZyYWMlN0IlN0IlN0IlN0IlNUNjb3MlMjAlN0QlNUUlN0JuJTIwLSUyMDElN0QlN0QlMjglNUN0aGV0YSUyMCUyOXNpbiUyOCU1Q3RoZXRhJTIwJTI5JTdEJTdEJTdCJTdCbiUyMC0lMjAxJTdEJTdEJTVEXzAlNUUlN0IlNUNwaSUyMCUyRjIlN0QlMjAlMkIlMjAlNUNmcmFjJTdCMSU3RCU3QiU3Qm4lMjAtJTIwMSU3RCU3RCU1Q2ludCU1Q2xpbWl0c18wJTVFJTdCJTVDcGklMjAlMkYyJTdEJTIwJTdCJTdCJTdCJTVDY29zJTIwJTdEJTVFbiU3RCUyOCU1Q3RoZXRhJTIwJTI5JTdEJTIwZCU1Q3RoZXRhJTIw.png)

因此可以得到Wn = Wn - 2 + Wn / (n - 1)
Wallis积分是一个递归表达式,n为偶数或者奇数时分别取不同的结果
当n为偶数时

当n为奇数时

由于Var( Tn ) = C n I n, 分别将C n和 I n代入式中,最终得到的方差为

方法二: LOTUS
根据定义
![E[Z] = \int {\int {f(u,x)p(u,x)dudx} }](/image/aHR0cDovL2NoYXJ0LmFwaXMuZ29vZ2xlLmNvbS9jaGFydD9jaHQ9dHgmY2hzPTF4MCZjaGY9YmcscyxGRkZGRkYwMCZjaGNvPTAwMDAwMCZjaGw9RSU1QlolNUQlMjAlM0QlMjAlNUNpbnQlMjAlN0IlNUNpbnQlMjAlN0JmJTI4dSUyQ3glMjlwJTI4dSUyQ3glMjlkdWR4JTdEJTIwJTdEJTIw.png)
![Var({T_n}) = E[T_n^2]](/image/aHR0cDovL2NoYXJ0LmFwaXMuZ29vZ2xlLmNvbS9jaGFydD9jaHQ9dHgmY2hzPTF4MCZjaGY9YmcscyxGRkZGRkYwMCZjaGNvPTAwMDAwMCZjaGw9VmFyJTI4JTdCVF9uJTdEJTI5JTIwJTNEJTIwRSU1QlRfbiU1RTIlNUQ=.png)





设x = 2y 然后得到dx = 2dy



