在概率論中,我們引入了事件這一概念,它表示試驗的結果。這個結果有時是一個數值,如投擲一枚骰子,結果可能是1、2、3……;有時是用文字描述的,如檢驗一個產品,結果可能是合格、不合格。
為了方便數學上的處理,我們需要將隨機事件進行數量化,如將合格指定為0,不合格指定為1。經過這樣的處理后,隨機事件就可以用一個數量標識$X$來表示,如某次檢驗的可能結果為合格和不合格,則$X$的可能取值為0(代表合格)和1(代表不合格)。
隨機變量、概率函數
一次試驗有n種結果,則$X$的可能取值有$x_1,x_2,...,x_n$,且每個值對應的概率為$P(x_1),P(x_2),...,P(x_n)$,其中$P(x_i)=P(X=x_i)$。我們把這樣的數量標識$X$稱為$P(X)$的隨機變量,$P(X)$稱為隨機變量$X$的概率函數。
各隨機事件對應一定的概率,隨機變量也對應於一定的概率,隨機變量可視為隨機事件的推廣。隨機變量可分為2類:離散型隨機變量和連續型隨機變量。
離散型隨機變量
如果隨機變量$X$的取值可以列舉出來,則稱$X$為離散型隨機變量。
離散型隨機變量的概率分布
設$X$的可能取值為$x_1,x_2,...,x_n$,對應的概率為$p_1,p_2,...,p_n$,如下表所示:

這樣的表格就是$X$的概率分布,其中$P(X=x_i)=p_i$是$X$的概率函數。
離散型隨機變量的期望值和方差
對於一個隨機變量$X$,我們當然希望知道它的概率分布(如上面的表格),但這是比較困難的,在很多情況下,我們只需要知道它的某些數字特征就足夠了。而在這些數字特征中,最重要的就是期望值和方差。
期望值
期望值的定義:
隨機變量$X$的完備事件組中,各可能值$x_i$與其概率$p_i$的乘積之和,稱為該隨機變量的期望值,記為$E(X)$或$\mu $。
期望值可以表示隨機變量的集中程度,離散型隨機變量$X$的期望值為:
$$E(X)=x_1p_1+x_2p_2+\cdots +x_np_n=\sum_{i=1}^{n}x_ip_i$$
方差
方差的定義:
每一個隨機變量的取值與期望值的離差平方和的期望,稱為方差,記為$D(X)$或$\sigma ^{2}$:
$$\sigma ^{2}=D(X)=E\left [ X-E(X) \right ]^2$$
常用的簡化公式:
$$\sigma ^{2}=D(X)=E(X^2)-\left [ E(X) \right ]^2$$
方差可以反映隨機變量的離散程度,離散型隨機變量$X$的方差為:
$$\sigma ^{2}=D(X)=\sum_{i=1}^{n}\left [ x_i-E(X) \right ]^2\cdot p_i$$
標准差
$$\sigma =\sqrt{D(X)}$$
離散系數
標准差與期望值之比,用於比較不同期望值的總體之間的離中趨勢:
$$V=\frac{\sigma }{E(X)}$$
常見離散型隨機變量的概率分布
二項分布
- n重伯努利試驗
- 概率函數:
$$P\left \{ X=x \right \}=C_{n}^{x}p^xq^{n-x},x=0,1,2,\cdots ,n$$
- 期望值:
$$E(X)=np$$
- 方差:
$$D(X)=npq$$
- 特別地,當n=1時,二項分布轉化為0-1分布
泊松分布
- 描述在指定時間范圍內或在指定的面積或體積內,某事件出現的次數的分布
- 概率函數:
$$P(X)=\frac{\lambda ^xe^{-\lambda}}{x!},x=0,1,2,\cdots$$
- 期望值:
$$E(X)=\lambda$$
- 方差:
$$D(X)=\lambda$$
- 當$p$很小,$n$很大時,二項分布可近似為泊松分布($\lambda=np$)
連續型隨機變量
如果隨機變量$X$的取值無法逐個列舉出來,而是取數軸上某一區間的任一點,則稱$X$為連續性隨機變量。
概率密度、分布函數
我們知道在離散型隨機變量中,有一個表格來描述其概率分布,但是在連續型隨機變量中,是無法一一列舉出每個取值以及相應的概率的,那么如何描述連續型隨機變量的概率函數呢?
首先介紹一個概念叫概率密度函數$f(x)$,它滿足2個條件:
(1)$f(x)\geq 0$
(2)$\int_{-\infty }^{+\infty }f(x)dx=1$
有了概率密度函數之后,我們引入了分布函數$F(x)$這一概念,它定義為:
$$F(x)=P(X\leqslant x)=\int_{-\infty }^{x}f(t)dt,-\infty< x< + \infty $$

要注意,$f(x)$並不是一個概率,其曲線下面積(積分)才是概率,$F(x)$表示隨機變量$X$的取值在$(-\infty ,x)$范圍內的概率。概率密度函數和分布函數的引入非常有意義,它使得我們可以在概率論中運用微積分這一重要的工具了。
連續型隨機變量的期望值和方差
1.期望值
$$E(X)=\int_{-\infty }^{+\infty}xf(x)dx=\mu$$
2.方差
$$D(X)=\int_{-\infty }^{+\infty}\left [ x-E(x) \right ]^2f(x)dx=\sigma ^2$$
正態分布
在所有的連續型隨機變量中,有一種叫正態隨機變量,其概率分布稱為正態分布,它是最重要的連續分布。
隨機變量$X$服從正態分布,記作$X\sim N(\mu,\sigma^2)$,它有2個參數$\mu$和$\sigma$,概率密度函數是:
$$f(x)=\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2\sigma^2}(x-\mu)^2},-\infty<x<+\infty$$
標准正態分布
當正態分布的2個參數,$\mu=0,\sigma=1$時,稱$X$服從標准正態分布,$X\sim N(0,1)$,概率密度函數為:
$$f(x)=\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{x^2}{2}},-\infty<x<+\infty$$
$\varphi(x)$表示概率密度函數,$\Phi(x) $表示分布函數,圖形如下:

標准正態化
將任意一個正態分布經線性變換轉化為標准正態分布,設$X\sim N(\mu,\sigma^2)$,則
$$Z=\frac{X-\mu}{\sigma}\sim N(0,1)$$
正態分布表
標准正態分布可以查表,對於負的$x$,由下式轉換:
$$\Phi(-x)=1- \Phi(x) $$

