隨機變量的概率分布

本文轉載自查看原文 2019-08-16 14:49 461 統計學

在概率論中，我們引入了事件這一概念，它表示試驗的結果。這個結果有時是一個數值，如投擲一枚骰子，結果可能是1、2、3……；有時是用文字描述的，如檢驗一個產品，結果可能是合格、不合格。

為了方便數學上的處理，我們需要將隨機事件進行數量化，如將合格指定為0，不合格指定為1。經過這樣的處理后，隨機事件就可以用一個數量標識$X$來表示，如某次檢驗的可能結果為合格和不合格，則$X$的可能取值為0（代表合格）和1（代表不合格）。

隨機變量、概率函數

一次試驗有n種結果，則$X$的可能取值有$x_1,x_2,...,x_n$，且每個值對應的概率為$P(x_1),P(x_2),...,P(x_n)$，其中$P(x_i)=P(X=x_i)$。我們把這樣的數量標識$X$稱為$P(X)$的隨機變量，$P(X)$稱為隨機變量$X$的概率函數。

各隨機事件對應一定的概率，隨機變量也對應於一定的概率，隨機變量可視為隨機事件的推廣。隨機變量可分為2類：離散型隨機變量和連續型隨機變量。

離散型隨機變量

如果隨機變量$X$的取值可以列舉出來，則稱$X$為離散型隨機變量。

離散型隨機變量的概率分布

設$X$的可能取值為$x_1,x_2,...,x_n$，對應的概率為$p_1,p_2,...,p_n$，如下表所示：

這樣的表格就是$X$的概率分布，其中$P(X=x_i)=p_i$是$X$的概率函數。

離散型隨機變量的期望值和方差

對於一個隨機變量$X$，我們當然希望知道它的概率分布（如上面的表格），但這是比較困難的，在很多情況下，我們只需要知道它的某些數字特征就足夠了。而在這些數字特征中，最重要的就是期望值和方差。

期望值

期望值的定義：

隨機變量$X$的完備事件組中，各可能值$x_i$與其概率$p_i$的乘積之和，稱為該隨機變量的期望值，記為$E(X)$或$\mu $。

期望值可以表示隨機變量的集中程度，離散型隨機變量$X$的期望值為：

$$E(X)=x_1p_1+x_2p_2+\cdots +x_np_n=\sum_{i=1}^{n}x_ip_i$$

方差

方差的定義：

每一個隨機變量的取值與期望值的離差平方和的期望，稱為方差，記為$D(X)$或$\sigma ^{2}$：

$$\sigma ^{2}=D(X)=E\left [ X-E(X) \right ]^2$$

常用的簡化公式：

$$\sigma ^{2}=D(X)=E(X^2)-\left [ E(X) \right ]^2$$

方差可以反映隨機變量的離散程度，離散型隨機變量$X$的方差為：

$$\sigma ^{2}=D(X)=\sum_{i=1}^{n}\left [ x_i-E(X) \right ]^2\cdot p_i$$

標准差

$$\sigma =\sqrt{D(X)}$$

離散系數

標准差與期望值之比，用於比較不同期望值的總體之間的離中趨勢：

$$V=\frac{\sigma }{E(X)}$$

常見離散型隨機變量的概率分布

二項分布

n重伯努利試驗
概率函數：

$$P\left \{ X=x \right \}=C_{n}^{x}p^xq^{n-x},x=0,1,2,\cdots ,n$$

期望值：

$$E(X)=np$$

方差：

$$D(X)=npq$$

特別地，當n=1時，二項分布轉化為0-1分布

泊松分布

描述在指定時間范圍內或在指定的面積或體積內，某事件出現的次數的分布
概率函數：

$$P(X)=\frac{\lambda ^xe^{-\lambda}}{x!},x=0,1,2,\cdots$$

期望值：

$$E(X)=\lambda$$

方差：

$$D(X)=\lambda$$

當$p$很小，$n$很大時，二項分布可近似為泊松分布（$\lambda=np$）

連續型隨機變量

如果隨機變量$X$的取值無法逐個列舉出來，而是取數軸上某一區間的任一點，則稱$X$為連續性隨機變量。

概率密度、分布函數

我們知道在離散型隨機變量中，有一個表格來描述其概率分布，但是在連續型隨機變量中，是無法一一列舉出每個取值以及相應的概率的，那么如何描述連續型隨機變量的概率函數呢？

首先介紹一個概念叫概率密度函數$f(x)$，它滿足2個條件：

（1）$f(x)\geq 0$

（2）$\int_{-\infty }^{+\infty }f(x)dx=1$

有了概率密度函數之后，我們引入了分布函數$F(x)$這一概念，它定義為：

$$F(x)=P(X\leqslant x)=\int_{-\infty }^{x}f(t)dt,-\infty< x< + \infty $$

要注意，$f(x)$並不是一個概率，其曲線下面積（積分）才是概率，$F(x)$表示隨機變量$X$的取值在$(-\infty ,x)$范圍內的概率。概率密度函數和分布函數的引入非常有意義，它使得我們可以在概率論中運用微積分這一重要的工具了。

連續型隨機變量的期望值和方差

1.期望值

$$E(X)=\int_{-\infty }^{+\infty}xf(x)dx=\mu$$

2.方差

$$D(X)=\int_{-\infty }^{+\infty}\left [ x-E(x) \right ]^2f(x)dx=\sigma ^2$$

正態分布

在所有的連續型隨機變量中，有一種叫正態隨機變量，其概率分布稱為正態分布，它是最重要的連續分布。

隨機變量$X$服從正態分布，記作$X\sim N(\mu,\sigma^2)$，它有2個參數$\mu$和$\sigma$，概率密度函數是：

$$f(x)=\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2\sigma^2}(x-\mu)^2},-\infty<x<+\infty$$

標准正態分布

當正態分布的2個參數，$\mu=0,\sigma=1$時，稱$X$服從標准正態分布，$X\sim N(0,1)$，概率密度函數為：

$$f(x)=\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{x^2}{2}},-\infty<x<+\infty$$

$\varphi(x)$表示概率密度函數，$\Phi(x) $表示分布函數，圖形如下：

標准正態化

將任意一個正態分布經線性變換轉化為標准正態分布，設$X\sim N(\mu,\sigma^2)$，則

$$Z=\frac{X-\mu}{\sigma}\sim N(0,1)$$

正態分布表

標准正態分布可以查表，對於負的$x$，由下式轉換：

$$\Phi(-x)=1- \Phi(x) $$

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 隨機變量概率分布函數匯總 MATLAB 一維隨機變量及其概率分布二維離散型隨機變量概率分布、邊緣分布和條件分布概率統計學習——（二）隨機變量及其分布概率論04 隨機變量多維隨機變量及其分布統計2：隨機變量及其分布【初等概率論】 02 - 條件概率和隨機變量《概率統計》2.離散型隨機變量：分布與數字特征用均勻分布隨機變量生成泊松分布隨機變量