楔子
在上一篇里,介紹了離散型隨機變量。但實際上,取值於連續區域的隨機變量的應用領域也是十分普遍的。比如汽車行駛的速度、設備連續正常運行的時間等,這些在實際應用中都非常廣泛,連續型隨機變量能夠刻畫一些離散型隨機變量無法描述的問題。
概率密度函數
我們說離散型隨機變量對應的取值個數是可數的,它的分布列對應概率質量函數PMF
;而連續性隨機變量對應的取值數量則往往是不可數的,而離散型隨機變量分布列則對應概率密度函數PDF
,這兩者的概念是完全相對應的。我們可以說該隨機變量對應的分布列,也可以說該隨機變量對應的概率函數(根據離散或連續,可以是質量或密度)
我們回顧一下離散型隨機變量分布列:
通過將三個事件所對應的概率值進行相加,就能得到這個事件集合所對應的總的概率:P(X∈S) = Px(1) + Px(2) + Px(3)
而連續型隨機變量和離散型隨機變量最明顯的不同點是,連續型隨機變量的個數是無限的、不可數的,不是像這樣直接簡單相加,而是在實軸的區間范圍內,對概率密度函數進行積分運算。
這里,我們要對概率密度函數的特殊性進行強調:
第一:實數軸上單個點的概率密度函數 PDF,其值不是概率,而是概率律,因此他的取值是可以大於 1 的。
第二:連續型隨機變量的概率,我們一般討論的是在一個區域內取值的概率,而不是某個單點的概率值。實際上,在連續區間內討論單個點是沒有意義的。
連續型隨機變量在一個區間內取值的概率,我們可以通過求積分來計算解決。例如上圖中,隨機變量在區間[a, b]
內的概率即為:
也就是圖中陰影區間內的面積。因此這也進一步印證了上面的第二條結論,也就是說我們關注的不是單個點而是一個取值區間的概率計算。
當x=a時,P(a≤X≤a) = 0,因此即便區間兩邊相等也無所謂
同理P(a≤ X ≤b) = P(a≤ X <b) = P(a< X ≤b) = P(a< X <b)
同樣的,我們繼續進行類比,連續型隨機變量概率的非負性和歸一性體現在:
非負性:對一切的x都有fX(x) > 0
歸一化:P(-∞ ≤ X ≤ +∞) = 1
連續型隨機變量的期望與方差
千萬不要到了這個連續型的新場景下就慌了手腳。在離散型隨機變量中,我們通過分布列,求得加權的均值,即獲得了離散型隨機變量的期望。即:每一個可能的取值乘上對應的概率再相加
那么在連續型隨機變量的場景下,我們死摳定義,期望 E[X] 的核心定義是大量獨立重復試驗中,隨機變量 X 取值的平均數(可不是直接將可能的取值加起來再除以總數,而是像我們上面說的那樣,可能的取值乘上對應的概率、再分別相加,要考慮到權重在里面。)
,那么我們此時將分布列替換成概率密度函數 PDF,求和替換成求積分就可以了,即:
方差也是一樣,扣定義:方差是隨機變量到期望的距離的平方
的期望
:
關於方差可能比較繞,我們先不考慮隨機變量、而是考慮一組數字10 20 30 40,我們說這一組值的方差就等於
每一個值到平均值距離的平方
然后再相加、除以總個數
。現在換成離散型隨機變量,那么把平均值換成期望,先計算每一個值到期望距離的平方
,然后不要相加、除以總個數
,而是各自乘上對應的概率然后直接相加即可,因為要考慮到權重
。那么對於連續型就是把概率質量函數換成概率密度函數即可,所以說方差是隨機變量到期望的距離的平方
的期望
然后我們來看幾個非常重要的連續型隨機變量的實際舉例
正態分布
正態分布是連續型隨機變量概率分布中的一種,你幾乎能在各行各業中看到他的身影,自然界中某地多年統計的年降雪量、人類社會中比如某地高三男生平均身高、教育領域中的某地區高考成績、信號系統中的噪音信號等,大量自然、社會現象均按正態形式分布。
正態分布中有兩個參數,一個是隨機變量的均值 μ,另一個是隨機變量的標准差 σ,他的概率密度函數 PDF 為:
當我們指定不同的均值和標准差參數后,就能得到不同正態分布的概率密度曲線,正態分布的概率密度曲線形狀都是類似的,他們都是關於均值 μ 對稱的鍾形曲線,概率密度曲線在離開均值區域后,呈現出快速的下降形態。另外,當均值 μ=0,標准差 σ=1 時,我們稱之為標准正態分布。
import numpy as np
from scipy.stats import norm
import plotly.graph_objs as go
x = np.linspace(-10, 10, 1000)
normal_1 = norm(loc=0, scale=1).pdf(x)
normal_2 = norm(loc=1, scale=2).pdf(x)
normal_3 = norm(loc=-1, scale=2).pdf(x)
trace1 = go.Scatter(x=x,
y=normal_1,
line={"width": 4, "color": "green"},
name="均值為0、方差為1")
trace2 = go.Scatter(x=x,
y=normal_2,
line={"width": 4, "color": "yellow"},
name="均值為1、方差為2")
trace3 = go.Scatter(x=x,
y=normal_3,
line={"width": 4, "color": "red"},
name="均值為-1、方差為2")
fig = go.Figure(data=[trace1, trace2, trace3], layout={"template": "plotly_dark"})
fig.show()
我們看到對於正太分布來講,平均值就是曲線頂點的x軸坐標。平均值增大,那么曲線會向右移動、反之向左移動。方差越大則是曲線越瘦高,越小則曲線越矮胖。
指數分布
我們再來看看我們要講的第二種連續型隨機變量,指數隨機變量。指數隨機變量的用處非常廣泛,他一般用來表征直到某件事情發生為止所用的時間。
比如,從現在你觀察的時間開始算起,一台儀器設備的使用壽命終止還剩的時間、一個燈泡直到用壞了還剩的時間、隕石掉入地球沙漠還需要的時間等。
指數隨機變量 X 的概率密度函數為:
其中,指數分布的參數是 λ,且必須滿足 λ>0,指數分布的圖形特征是當隨機變量 X 超過某個值時,概率隨着這個值的增加而呈指數遞減。討論指數分布的概率特性時,我們一般着重注意三個方面的內容:
-
第一個:隨機變量 X 超過某個指定值 a 的概率,當然此處需要滿足 a≥0。依照定義,我們有:
-
第二個:隨機變量 X 位於區間 [a,b] 內的概率,實際上也很簡單:
-
第三個:也就是整個指數分布的數字特征,同時也包含參數 λ 的物理含義。我們在這里可以通過期望和方差的定義,直接用積分求得,這里就不多贅述,直接拿出結論:E[X] = 1 / λ、V[X] = 1 / λ^2