概率統計學習——(二)隨機變量及其分布


參考自 盛驟, 謝式千, 潘承毅. 概率論與數理統計 第四版[M]// 概率論與數理統計, 第四版. 高等教育出版社, 2008.

隨機變量及其分布

設隨機實驗的樣本空間為S={e}. X=X(e)是定義在樣本空間S上的實值單值函數. 稱X=X(e)為隨機變量
書中作者注: 嚴格地說“對於任意實數x,集合{e|X(e)≤x} (即: 使得X(e)≤x的所有樣本點e所組成的集合) 有確定的概率” 這一要求應包括在隨機變量的定義之中,一般來說,不滿足這一條件的情況,在實際應用中是很少遇到的

離散型隨機變量

有些隨機變量,它全部可能取到的值是有限個,或可列無限多個,這種隨機變量稱為離散型隨機變量.

三種重要的離散型隨機變量

  • (0-1)分布, 也稱兩點分布
    隨機變量X只能取0或者1,它的分布律是
    \(P\{X=k\}=p^{k}(1-p)^{1-k}, k=0,1 \quad(0<p<1)\)
    則稱X服從以p為參數的(0-1)分布或兩點分布

  • 伯努利試驗、二項分布
    試驗E只有兩個可能的結果,A和\(\bar{A}\),則稱E為伯努利(Bernoulli)試驗. 將E獨立重復地進行n次,則稱這一串重復的獨立試驗為n重伯努利試驗.
    這里重復是指在每次試驗中P(A)=p保持不變;“獨立”是指各次試驗的結果互不影響.

在n次試驗中A發生k次的概率為\(\left(\begin{array}{l}n \\ k\end{array}\right) p^{k}(1-p)^{n-k}\),記q=1-p,即有
\(P\{X=k\}=\left(\begin{array}{l}n \\ k\end{array}\right) p^{k} q^{n-k}, k=0,1,2, \cdots, n\)
注意到\(\left(\begin{array}{l}n \\ k\end{array}\right) p^{k}(1-p)^{n-k}\)剛好是二項式\((p+q)^{n}\)展開式中出現\((p)^{k}\)的那一項,我們成隨機變量X服從參數為n,p的二項分布,並記為\(X \sim b(n, p)\).
特別,當n=1時二項分布化為
\(P\{X=k\}=p^{k} q^{1-k}, \quad k=0,1\).
這就是(0-1)分布。

  • 泊松分布
    設隨機變量X所有可能取的值為0,1,2,...,而去各個值的概率為
    \(P\{X=k\}=\frac{\lambda^{k} \mathrm{e}^{-\lambda}}{k !}, k=0,1,2, \cdots,\)
    其中λ>0是常數. 則稱X服從參數為λ的泊松分布,記為\(X \sim \pi(\lambda)\)
    易知\(P\{X=k\} \geqslant 0, k=0,1,2, \cdots,\) 且有
    \(\sum_{k=0}^{\infty} P\{X=k\}=\sum_{k=0}^{\infty} \frac{\lambda^{k} \mathrm{e}^{-\lambda}}{k !}=\mathrm{e}^{-\lambda} \sum_{k=0}^{\infty} \frac{\lambda^{k}}{k !}=\mathrm{e}^{-\lambda} \cdot \mathrm{e}^{\lambda}=1\)

泊松定理 設λ>0是一個常數,n是任意正整數,設\(n p_{n}=\lambda\),則對於任一固定的非負整數k,有

\[\lim _{n \rightarrow \infty}\left(\begin{array}{l} n \\ k \end{array}\right) p_{n}^{k}\left(1-p_{n}\right)^{n-k}=\frac{\lambda^{k} \mathrm{e}^{-\lambda}}{k !}\]

定義 設X是一個隨機變量,x是任意實數,函數

\[F(x)=P\{X \leqslant x\},-\infty<x<\infty \]

稱為X的分布函數.
對於任一實數x1,x2 (x1<x2)有

\[\begin{aligned} P\left\{x_{1}<X \leqslant x_{2}\right\} &=P\left\{X \leqslant x_{2}\right\}-P\left\{X \leqslant x_{1}\right\} \\ &=F\left(x_{2}\right)-F\left(x_{1}\right) \end{aligned}\]

因此,若已知X的分布函數,我們就知道X落在任意區間(x1,x2]上的概率,從這個意義上說,分布函數完整地描述了隨機變量的統計規律性.

分布函數F(x)具有以下的基本性質:
1° F(x)是一個不減函數.
2° 0≤F(x)≤1,且

\[\begin{array}{c} F(-\infty)=\lim _{x \rightarrow-\infty} F(x)=0 \\ F(\infty)=\lim F(x)=1 \end{array}\]

連續型隨機變量及其概率密度

如果對於隨機變量X的分布函數F(x),存在非負函數f(x),使對於任意實數x有

\[F(x)=\int_{-\infty}^{x} f(t) \mathrm{d} t \]

則稱X為連續性隨機變量,其中函數f(x)稱為X的概率密度函數,簡稱概率密度.
三種重要的連續型隨機變量

  • 均勻分布
    若連續型隨機變量X具有概率密度

\[f(x)=\left\{\begin{array}{ll} \frac{1}{b-a}, & a<x<b \\ 0, & \text { 其他, } \end{array}\right.\]

則稱X在區間(a,b)上服從均勻分布. 記為X~U(a,b).
X的分布函數為

\[F(x)=\left\{\begin{array}{ll} 0, & x<a \\ \frac{x-a}{b-a}, & a \leqslant x<b \\ 1, & x \geqslant b \end{array}\right.\]

  • 指數分布
    若連續型隨機變量X的概率密度為

\[f(x)=\left\{\begin{array}{ll} \frac{1}{\theta} \mathrm{e}^{-x / \theta}, x>0 \\ 0, & \text { 其他 } \end{array}\right.\]

其中θ>0為常數,則稱X服從參數為θ的指數分布.
X的分布函數為

\[F(x)=\left\{\begin{array}{ll} 1-\mathrm{e}^{-x / \theta}, & x>0 \\ 0, & \text { 其他 } . \end{array}\right.\]

服從指數分布的隨機變量X具有以下性質:
對於任意s, t>0, 有

\[P\{X>s+t \mid X>s\}=P\{X>t\} \]

事實上

\[\begin{aligned} P\{X>s+t \mid X>s\} &=\frac{P\{(X>s+t) \cap(X>s)\}}{P\{X>s\}} \\ &=\frac{P\{X>s+t\}}{P\{X>s\}}=\frac{1-F(s+t)}{1-F(s)} \\ &=\frac{\mathrm{e}^{-(s+t) / \theta}}{\mathrm{e}^{-s / \theta}}=\mathrm{e}^{-t / \theta} \\ &=P\{X>t\} \end{aligned}\]

以上性質稱為無記憶性.
如果X是某一元件的壽命,那么上式表明,已知元件已使用了s小時,它總共能使用至少s+t小時的條件概率,與從開始使用時算起它至少能使用t小時的概率相等. 這就是說,元件對它已使用過s小時沒有記憶. 具有這一性質是指數分布有廣泛應用的重要原因.
指數分布在可靠性理論與排隊論中有廣泛的應用.

  • 正態分布(高斯分布)
    若連續型隨機變量X的概率密度為

\[f(x)=\frac{1}{\sqrt{2 \pi} \sigma} \mathrm{e}^{-\frac{(x-\mu)^{2}}{2 \sigma^{2}}},-\infty<x<\infty \]

其中μ, σ (σ>0)為常數,則稱X服從參數為μ, σ的正態分布或高斯分布, 記為$$X \sim N\left(\mu, \sigma^{2}\right)$$
具有以下性質
1° 曲線關於x=μ對稱.
2° 當x=μ時取到最大值

\[f(\mu)=\frac{1}{\sqrt{2 \pi} \sigma} \]


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM