樣本均值與樣本方差
樣本均值:$\overline{X}=\frac{\sum_{i=1}^k X_i}{k}$
樣本方差:$Var(X)=\frac{\sum_{i=1}^k |X_i-\overline{X}|}{k}$
正態分布
$f(x|\mu,\sigma^2)=\frac{1}{(2\pi)^1/2}exp[-\frac{1}{2}(\frac{x-\mu}{\sigma})^2]$ , $\mu$為均值,$\sigma$為標准差,$\mu$決定了中心軸的位置,$\sigma$決定了函數的高度。
標准正態函數:
$f(x|0,1)=\frac{1}{(2\pi)^1/2}exp(-\frac{1}{2}x^2)$
伽馬分布
首先說說伽馬分布的由來,伽馬分布是基於著名的伽馬函數推導而來,過程如下
$\Gamma(a)=\int_0^\infty {x^{a-1}e^{-x}dx}\quad\quad\text{伽馬函數}$
$\Gamma(n)=(n-1)\Gamma(n-1)=(n-1)!\Gamma(1)$
$\Gamma(\frac{1}{2})=\pi^{\frac{1}{2}}$
設$x = \mu \beta = \varphi (\mu )$
根據$x = \varphi (\mu ),\int {f(x)g(x)} dx = \int {f \circ } \varphi (\mu )g \circ \varphi (\mu )\varphi '(\mu )$
得到:$\Gamma (a) = {\beta ^a}\int_0^\infty {{\mu ^{a - 1}}{e^{ - \mu \beta }}d\mu } $
所以伽馬分布(概率密度函數)為: $f(\mu|a,\beta)=\frac{\beta ^a}{\Gamma (a)} {\mu ^{a - 1}}{e^{ - \mu \beta }}$
這樣,在對 $f(\mu|a,\beta)$求$\int_0^{+\infty}$的時候(伽馬分布的概率分布函數),結果永遠等於1.
卡方分布
公式:$f(x) = \frac{1}{{{2^{n/2}}\Gamma (n/2)}}{x^{n/2 - 1}}{e^{ - x/2}}$
這是一個自由度為2的卡方分布,其實是一個$\Gamma$分布的變形,當$\alpha = 1$ , 並且$\beta = 1/2$的$\Gamma$分布。
為什么要叫卡方分布呢?這個公式又跟正態分布有千絲萬縷的關系,對於一個隨機變量$X$,服從標准正態分布,則$X$的隨機變量的平方$Y=X^2$便服從自由度為1的卡方分布,推導過程略去,自由度該如何取值呢? 如果一個隨機變量自由度就是1,如果是$X_1....X_k$自由度就是k了,並且$X_1^2....X_k^2$服從自由度為k的卡方分布。就是正態分布的隨機變量的平方就是卡方分布。