隨機變量的概率分布


在概率論中,我們引入了事件這一概念,它表示試驗的結果。這個結果有時是一個數值,如投擲一枚骰子,結果可能是1、2、3……;有時是用文字描述的,如檢驗一個產品,結果可能是合格、不合格。

為了方便數學上的處理,我們需要將隨機事件進行數量化,如將合格指定為0,不合格指定為1。經過這樣的處理后,隨機事件就可以用一個數量標識$X$來表示,如某次檢驗的可能結果為合格和不合格,則$X$的可能取值為0(代表合格)和1(代表不合格)。

 

 

隨機變量、概率函數

一次試驗有n種結果,則$X$的可能取值有$x_1,x_2,...,x_n$,且每個值對應的概率為$P(x_1),P(x_2),...,P(x_n)$,其中$P(x_i)=P(X=x_i)$。我們把這樣的數量標識$X$稱為$P(X)$的隨機變量,$P(X)$稱為隨機變量$X$的概率函數

各隨機事件對應一定的概率,隨機變量也對應於一定的概率,隨機變量可視為隨機事件的推廣。隨機變量可分為2類:離散型隨機變量和連續型隨機變量。

 

 

 

離散型隨機變量

如果隨機變量$X$的取值可以列舉出來,則稱$X$為離散型隨機變量

 

離散型隨機變量的概率分布

設$X$的可能取值為$x_1,x_2,...,x_n$,對應的概率為$p_1,p_2,...,p_n$,如下表所示:

這樣的表格就是$X$的概率分布,其中$P(X=x_i)=p_i$是$X$的概率函數

 

離散型隨機變量的期望值和方差

對於一個隨機變量$X$,我們當然希望知道它的概率分布(如上面的表格),但這是比較困難的,在很多情況下,我們只需要知道它的某些數字特征就足夠了。而在這些數字特征中,最重要的就是期望值方差

期望值

期望值的定義:

隨機變量$X$的完備事件組中,各可能值$x_i$與其概率$p_i$的乘積之和,稱為該隨機變量的期望值,記為$E(X)$或$\mu $。

期望值可以表示隨機變量的集中程度,離散型隨機變量$X$的期望值為:

$$E(X)=x_1p_1+x_2p_2+\cdots +x_np_n=\sum_{i=1}^{n}x_ip_i$$

方差

方差的定義:

每一個隨機變量的取值與期望值的離差平方和的期望,稱為方差,記為$D(X)$或$\sigma ^{2}$:

$$\sigma ^{2}=D(X)=E\left [ X-E(X) \right ]^2$$

常用的簡化公式:

$$\sigma ^{2}=D(X)=E(X^2)-\left [ E(X) \right ]^2$$

方差可以反映隨機變量的離散程度,離散型隨機變量$X$的方差為:

$$\sigma ^{2}=D(X)=\sum_{i=1}^{n}\left [ x_i-E(X) \right ]^2\cdot p_i$$

標准差

$$\sigma =\sqrt{D(X)}$$

離散系數

標准差與期望值之比,用於比較不同期望值的總體之間的離中趨勢:

$$V=\frac{\sigma }{E(X)}$$

 

常見離散型隨機變量的概率分布

二項分布

  • n重伯努利試驗
  • 概率函數:

$$P\left \{ X=x \right \}=C_{n}^{x}p^xq^{n-x},x=0,1,2,\cdots ,n$$

  • 期望值:

$$E(X)=np$$

  • 方差:

$$D(X)=npq$$

  • 特別地,當n=1時,二項分布轉化為0-1分布

 

泊松分布

  • 描述在指定時間范圍內或在指定的面積或體積內,某事件出現的次數的分布
  • 概率函數:

$$P(X)=\frac{\lambda ^xe^{-\lambda}}{x!},x=0,1,2,\cdots$$

  • 期望值:

$$E(X)=\lambda$$

  • 方差:

$$D(X)=\lambda$$

  • 當$p$很小,$n$很大時,二項分布可近似為泊松分布($\lambda=np$)

 

 

 

連續型隨機變量

如果隨機變量$X$的取值無法逐個列舉出來,而是取數軸上某一區間的任一點,則稱$X$為連續性隨機變量

 

概率密度、分布函數

我們知道在離散型隨機變量中,有一個表格來描述其概率分布,但是在連續型隨機變量中,是無法一一列舉出每個取值以及相應的概率的,那么如何描述連續型隨機變量的概率函數呢?

首先介紹一個概念叫概率密度函數$f(x)$,它滿足2個條件:

(1)$f(x)\geq 0$

(2)$\int_{-\infty }^{+\infty }f(x)dx=1$

有了概率密度函數之后,我們引入了分布函數$F(x)$這一概念,它定義為:

$$F(x)=P(X\leqslant  x)=\int_{-\infty }^{x}f(t)dt,-\infty< x< + \infty $$

要注意,$f(x)$並不是一個概率,其曲線下面積(積分)才是概率,$F(x)$表示隨機變量$X$的取值在$(-\infty ,x)$范圍內的概率。概率密度函數和分布函數的引入非常有意義,它使得我們可以在概率論中運用微積分這一重要的工具了。

 

連續型隨機變量的期望值和方差

1.期望值

$$E(X)=\int_{-\infty }^{+\infty}xf(x)dx=\mu$$

2.方差

$$D(X)=\int_{-\infty }^{+\infty}\left [ x-E(x) \right ]^2f(x)dx=\sigma ^2$$

  

正態分布

在所有的連續型隨機變量中,有一種叫正態隨機變量,其概率分布稱為正態分布,它是最重要的連續分布。

隨機變量$X$服從正態分布,記作$X\sim N(\mu,\sigma^2)$,它有2個參數$\mu$和$\sigma$,概率密度函數是:

$$f(x)=\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2\sigma^2}(x-\mu)^2},-\infty<x<+\infty$$

標准正態分布

當正態分布的2個參數,$\mu=0,\sigma=1$時,稱$X$服從標准正態分布,$X\sim N(0,1)$,概率密度函數為:

$$f(x)=\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{x^2}{2}},-\infty<x<+\infty$$

$\varphi(x)$表示概率密度函數,$\Phi(x) $表示分布函數,圖形如下:

標准正態化

將任意一個正態分布經線性變換轉化為標准正態分布,設$X\sim N(\mu,\sigma^2)$,則

$$Z=\frac{X-\mu}{\sigma}\sim N(0,1)$$

正態分布表

標准正態分布可以查表,對於負的$x$,由下式轉換:

$$\Phi(-x)=1- \Phi(x) $$

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM