《概率統計》3.連續型隨機變量:分布與數字特征


楔子

在上一篇里,介紹了離散型隨機變量。但實際上,取值於連續區域的隨機變量的應用領域也是十分普遍的。比如汽車行駛的速度、設備連續正常運行的時間等,這些在實際應用中都非常廣泛,連續型隨機變量能夠刻畫一些離散型隨機變量無法描述的問題。

概率密度函數

我們說離散型隨機變量對應的取值個數是可數的,它的分布列對應概率質量函數PMF;而連續性隨機變量對應的取值數量則往往是不可數的,而離散型隨機變量分布列則對應概率密度函數PDF,這兩者的概念是完全相對應的。我們可以說該隨機變量對應的分布列,也可以說該隨機變量對應的概率函數(根據離散或連續,可以是質量或密度)

我們回顧一下離散型隨機變量分布列:

通過將三個事件所對應的概率值進行相加,就能得到這個事件集合所對應的總的概率:P(X∈S) = Px(1) + Px(2) + Px(3)

而連續型隨機變量和離散型隨機變量最明顯的不同點是,連續型隨機變量的個數是無限的、不可數的,不是像這樣直接簡單相加,而是在實軸的區間范圍內,對概率密度函數進行積分運算。

這里,我們要對概率密度函數的特殊性進行強調:

  • 第一:實數軸上單個點的概率密度函數 PDF,其值不是概率,而是概率律,因此他的取值是可以大於 1 的。
  • 第二:連續型隨機變量的概率,我們一般討論的是在一個區域內取值的概率,而不是某個單點的概率值。實際上,在連續區間內討論單個點是沒有意義的。

連續型隨機變量在一個區間內取值的概率,我們可以通過求積分來計算解決。例如上圖中,隨機變量在區間[a, b]內的概率即為:

也就是圖中陰影區間內的面積。因此這也進一步印證了上面的第二條結論,也就是說我們關注的不是單個點而是一個取值區間的概率計算。

  • 當x=a時,P(a≤X≤a) = 0,因此即便區間兩邊相等也無所謂
  • 同理P(a≤ X ≤b) = P(a≤ X <b) = P(a< X ≤b) = P(a< X <b)

同樣的,我們繼續進行類比,連續型隨機變量概率的非負性和歸一性體現在:

非負性:對一切的x都有fX(x) > 0

歸一化:P(-∞ ≤ X ≤ +∞) = 1

連續型隨機變量的期望與方差

千萬不要到了這個連續型的新場景下就慌了手腳。在離散型隨機變量中,我們通過分布列,求得加權的均值,即獲得了離散型隨機變量的期望。即:每一個可能的取值乘上對應的概率再相加

那么在連續型隨機變量的場景下,我們死摳定義,期望 E[X] 的核心定義是大量獨立重復試驗中,隨機變量 X 取值的平均數(可不是直接將可能的取值加起來再除以總數,而是像我們上面說的那樣,可能的取值乘上對應的概率、再分別相加,要考慮到權重在里面。),那么我們此時將分布列替換成概率密度函數 PDF,求和替換成求積分就可以了,即:

方差也是一樣,扣定義:方差是隨機變量到期望的距離的平方期望

關於方差可能比較繞,我們先不考慮隨機變量、而是考慮一組數字10 20 30 40,我們說這一組值的方差就等於每一個值到平均值距離的平方然后再相加、除以總個數。現在換成離散型隨機變量,那么把平均值換成期望,先計算每一個值到期望距離的平方,然后不要相加、除以總個數,而是各自乘上對應的概率然后直接相加即可,因為要考慮到權重。那么對於連續型就是把概率質量函數換成概率密度函數即可,所以說方差是隨機變量到期望的距離的平方期望

然后我們來看幾個非常重要的連續型隨機變量的實際舉例

正態分布

正態分布是連續型隨機變量概率分布中的一種,你幾乎能在各行各業中看到他的身影,自然界中某地多年統計的年降雪量、人類社會中比如某地高三男生平均身高、教育領域中的某地區高考成績、信號系統中的噪音信號等,大量自然、社會現象均按正態形式分布。

正態分布中有兩個參數,一個是隨機變量的均值 μ,另一個是隨機變量的標准差 σ,他的概率密度函數 PDF 為:

當我們指定不同的均值和標准差參數后,就能得到不同正態分布的概率密度曲線,正態分布的概率密度曲線形狀都是類似的,他們都是關於均值 μ 對稱的鍾形曲線,概率密度曲線在離開均值區域后,呈現出快速的下降形態。另外,當均值 μ=0,標准差 σ=1 時,我們稱之為標准正態分布。

import numpy as np
from scipy.stats import norm
import plotly.graph_objs as go

x = np.linspace(-10, 10, 1000)
normal_1 = norm(loc=0, scale=1).pdf(x)
normal_2 = norm(loc=1, scale=2).pdf(x)
normal_3 = norm(loc=-1, scale=2).pdf(x)

trace1 = go.Scatter(x=x,
                    y=normal_1,
                    line={"width": 4, "color": "green"},
                    name="均值為0、方差為1")

trace2 = go.Scatter(x=x,
                    y=normal_2,
                    line={"width": 4, "color": "yellow"},
                    name="均值為1、方差為2")

trace3 = go.Scatter(x=x,
                    y=normal_3,
                    line={"width": 4, "color": "red"},
                    name="均值為-1、方差為2")

fig = go.Figure(data=[trace1, trace2, trace3], layout={"template": "plotly_dark"})
fig.show()

我們看到對於正太分布來講,平均值就是曲線頂點的x軸坐標。平均值增大,那么曲線會向右移動、反之向左移動。方差越大則是曲線越瘦高,越小則曲線越矮胖。

指數分布

我們再來看看我們要講的第二種連續型隨機變量,指數隨機變量。指數隨機變量的用處非常廣泛,他一般用來表征直到某件事情發生為止所用的時間。

比如,從現在你觀察的時間開始算起,一台儀器設備的使用壽命終止還剩的時間、一個燈泡直到用壞了還剩的時間、隕石掉入地球沙漠還需要的時間等。

指數隨機變量 X 的概率密度函數為:

其中,指數分布的參數是 λ,且必須滿足 λ>0,指數分布的圖形特征是當隨機變量 X 超過某個值時,概率隨着這個值的增加而呈指數遞減。討論指數分布的概率特性時,我們一般着重注意三個方面的內容:

  • 第一個:隨機變量 X 超過某個指定值 a 的概率,當然此處需要滿足 a≥0。依照定義,我們有:

  • 第二個:隨機變量 X 位於區間 [a,b] 內的概率,實際上也很簡單:

  • 第三個:也就是整個指數分布的數字特征,同時也包含參數 λ 的物理含義。我們在這里可以通過期望和方差的定義,直接用積分求得,這里就不多贅述,直接拿出結論:E[X] = 1 / λ、V[X] = 1 / λ^2


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM