參考自 盛驟, 謝式千, 潘承毅. 概率論與數理統計 第四版[M]// 概率論與數理統計, 第四版. 高等教育出版社, 2008.
隨機變量及其分布
設隨機實驗的樣本空間為S={e}. X=X(e)是定義在樣本空間S上的實值單值函數. 稱X=X(e)為隨機變量
書中作者注: 嚴格地說“對於任意實數x,集合{e|X(e)≤x} (即: 使得X(e)≤x的所有樣本點e所組成的集合) 有確定的概率” 這一要求應包括在隨機變量的定義之中,一般來說,不滿足這一條件的情況,在實際應用中是很少遇到的
離散型隨機變量
有些隨機變量,它全部可能取到的值是有限個,或可列無限多個,這種隨機變量稱為離散型隨機變量.
三種重要的離散型隨機變量
-
(0-1)分布, 也稱兩點分布
隨機變量X只能取0或者1,它的分布律是
\(P\{X=k\}=p^{k}(1-p)^{1-k}, k=0,1 \quad(0<p<1)\)
則稱X服從以p為參數的(0-1)分布或兩點分布 -
伯努利試驗、二項分布
試驗E只有兩個可能的結果,A和\(\bar{A}\),則稱E為伯努利(Bernoulli)試驗. 將E獨立重復地進行n次,則稱這一串重復的獨立試驗為n重伯努利試驗.
這里重復是指在每次試驗中P(A)=p保持不變;“獨立”是指各次試驗的結果互不影響.
在n次試驗中A發生k次的概率為\(\left(\begin{array}{l}n \\ k\end{array}\right) p^{k}(1-p)^{n-k}\),記q=1-p,即有
\(P\{X=k\}=\left(\begin{array}{l}n \\ k\end{array}\right) p^{k} q^{n-k}, k=0,1,2, \cdots, n\)
注意到\(\left(\begin{array}{l}n \\ k\end{array}\right) p^{k}(1-p)^{n-k}\)剛好是二項式\((p+q)^{n}\)展開式中出現\((p)^{k}\)的那一項,我們成隨機變量X服從參數為n,p的二項分布,並記為\(X \sim b(n, p)\).
特別,當n=1時二項分布化為
\(P\{X=k\}=p^{k} q^{1-k}, \quad k=0,1\).
這就是(0-1)分布。
- 泊松分布
設隨機變量X所有可能取的值為0,1,2,...,而去各個值的概率為
\(P\{X=k\}=\frac{\lambda^{k} \mathrm{e}^{-\lambda}}{k !}, k=0,1,2, \cdots,\)
其中λ>0是常數. 則稱X服從參數為λ的泊松分布,記為\(X \sim \pi(\lambda)\)
易知\(P\{X=k\} \geqslant 0, k=0,1,2, \cdots,\) 且有
\(\sum_{k=0}^{\infty} P\{X=k\}=\sum_{k=0}^{\infty} \frac{\lambda^{k} \mathrm{e}^{-\lambda}}{k !}=\mathrm{e}^{-\lambda} \sum_{k=0}^{\infty} \frac{\lambda^{k}}{k !}=\mathrm{e}^{-\lambda} \cdot \mathrm{e}^{\lambda}=1\)
泊松定理 設λ>0是一個常數,n是任意正整數,設\(n p_{n}=\lambda\),則對於任一固定的非負整數k,有
定義 設X是一個隨機變量,x是任意實數,函數
稱為X的分布函數.
對於任一實數x1,x2 (x1<x2)有
因此,若已知X的分布函數,我們就知道X落在任意區間(x1,x2]上的概率,從這個意義上說,分布函數完整地描述了隨機變量的統計規律性.
分布函數F(x)具有以下的基本性質:
1° F(x)是一個不減函數.
2° 0≤F(x)≤1,且
連續型隨機變量及其概率密度
如果對於隨機變量X的分布函數F(x),存在非負函數f(x),使對於任意實數x有
則稱X為連續性隨機變量,其中函數f(x)稱為X的概率密度函數,簡稱概率密度.
三種重要的連續型隨機變量
- 均勻分布
若連續型隨機變量X具有概率密度
則稱X在區間(a,b)上服從均勻分布. 記為X~U(a,b).
X的分布函數為
- 指數分布
若連續型隨機變量X的概率密度為
其中θ>0為常數,則稱X服從參數為θ的指數分布.
X的分布函數為
服從指數分布的隨機變量X具有以下性質:
對於任意s, t>0, 有
事實上
以上性質稱為無記憶性.
如果X是某一元件的壽命,那么上式表明,已知元件已使用了s小時,它總共能使用至少s+t小時的條件概率,與從開始使用時算起它至少能使用t小時的概率相等. 這就是說,元件對它已使用過s小時沒有記憶. 具有這一性質是指數分布有廣泛應用的重要原因.
指數分布在可靠性理論與排隊論中有廣泛的應用.
- 正態分布(高斯分布)
若連續型隨機變量X的概率密度為
其中μ, σ (σ>0)為常數,則稱X服從參數為μ, σ的正態分布或高斯分布, 記為$$X \sim N\left(\mu, \sigma^{2}\right)$$
具有以下性質
1° 曲線關於x=μ對稱.
2° 當x=μ時取到最大值