目錄
1、0-1分布(兩點分布、伯努利分布)
2、幾何分布
3、二項分布
4、高斯分布(正態分布)
5、卡方分布
(chi-square distribution)
6、t分布
- 6.1 置信區間
- 6.2 例題
7、泊松分布
8、指數分布
9、F分布
1、0-1分布
單個二值型離散隨機變量的分布,概率分布函數:

2、幾何分布
離散型概率分布,定義為:n次伯努利試驗中,試驗k次才能得到一次成功的機率。即前k-1次皆失敗,第k次成功的概率。
概率分布函數:

3、二項分布
n次伯努利試驗,各次試驗之間相互獨立,每次試驗只有兩種可能(拋硬幣),相互對立。設事件發生的概率是P,不發生的概率是1-P,n次重復獨立試驗中發生K次的概率:


4、高斯分布(正態分布)
隨機變量X服從數學期望為μ,方差為σ2的正態分布,記為N(μ,σ2)。

μ決定正態分布的位置。
標准差決定正態分布的幅度。

性質:

標准正態分布:μ=0,σ=1。
性質:
Φ(x)=1-Φ(-x)
![]()


5、卡方分布
(chi-square distribution)
若n個相互獨立的隨機變量ξ₁,ξ₂,...,ξn ,均服從標准正態分布N(0,1)(也稱獨立同分布於標准正態分布),則這n個服從標准正態分布的隨機變量的平方和構成一新的隨機變量,其分布規律稱為卡方分布(chi-square distribution)。
隨機變量 :![]()
記為:![]()
其中參數
稱為自由度,自由度不同就是另一個
分布。
卡方分布是由正態分布構造而成的一個新的分布,當自由度
很大時,
分布近似為正態分布。
性質:

6、t分布
正態分布是許多統計方法的理論基礎。μ和σ決定了正態分布的位置和形態。為了應用方便,常將一般的正太變量X通過u變換[(X-μ)/σ]轉化成標准正態分布N(0,1),使原來各種形態的正態分布都轉換成了μ=0,σ=1的標准正態分布,也稱為u分布 。
根據中心極限定理,通過抽樣模擬試驗表明,在正態分布總體以固定n抽取若干個樣本時,樣本均數的分布仍然服從正態分布N(μ,
)。所以對樣本均數(均值)的分布進行u變換,也可以變換為標准正態分布。
實際工作中,σ2(總體方差)是未知的,所以常用s作為σ的估計值,為了與u變換區別,稱為t變換。
統計量t值的分布稱為t分布。假設隨機變量X服從標准正態分布N(0,1),Y服從
分布,那么
的分布稱為自由度為n的t分布,記為 ![]()

可以看出t分布以0為中心,左右對稱的單峰分布;
t分布式一簇曲線,形態變化與n(確切的說自由度v)大小有關,自由度越小,t分布越低平;自由度越大,t分布曲線越接近標准正態分布(u分布)。
6.1 置信區間
已知X~N(μ,1)找一個區間,使得包含μ的真值的概率為95%,假n=5,則:
~ N(μ,
) ~ N(μ,1/5)

α = 1 - 95% = 0.05
查表得:![]()
查表的方法:直接在標准正態分布表里面找概率 = 1-α/2 時的 z 取值。
含義:正態分布左側的面積(概率)為0.975時候的橫坐標值。(上分位)
Z1-α/2:是下分位表示,意思是右側面積為0.975。
注意:置信區間雙側檢驗,所以要α/2.


稱隨機區間
為參數μ的置信度為95%的置信區間。
(1)已知總體方差,求總體均值的置信區間

是總體樣本均值;
α是顯著水平(1-置信度),若置信度是95%,則α=1-0.95=0.05;
Z α/2稱為Z值,可以查找標准正態分布表得到;(z(a/2)指的是標准正態分布的雙側臨界值,z(a)當然就是單側臨界值)σ:總體的標准差;
n:抽樣出來的樣本個數;
:樣本的標准誤差
(2)未知總體方差,求總體均值μ的置信區間

tα/2(n-1)稱為t值,通過查t分布表得到(tα/2(n-1) = t1-α/2(n-1));
S:樣本的標准差
:樣本的平均誤差
6.2 例題

7、泊松分布
日常生活中,大量事件是有固定頻率的,特點是我們可以預估這些事件的總數,但是沒法知道具體的發生時間。比如我們知道平均1小時生3個嬰兒,請問下一個小時會出生幾個?
泊松分布就是描述某段時間內,事件具體的發生概率:

其中,P表示概率,N(t)表示某種函數關系,t是事件,n是數量。一個小時內出生3個嬰兒的概率表示為P(N(1)=3),λ表示事件的頻率。
比如接下來兩個小時,一個嬰兒都不出聲的概率為:

接下來一個小時,至少出生兩個嬰兒的概率:

8、指數分布
事件的時間間隔的概率,無記憶性。
例如嬰兒出生的時間間隔,網站訪問的時間間隔。。。。
指數分布可以從泊松分布推到出來,如果下一個嬰兒要間隔時間t,就等同於t內沒有任何嬰兒出生:


9、F分布


是總體樣本均值;
:樣本的標准誤差
:樣本的平均誤差