從數學上看,分布函數F(x)=P(X<x),表示隨機變量X的值小於x的概率。這個意義很容易理解。概率密度f(x)是F(x)在x處的關於x的一階導數,即變化率。如果在某一x附近取非常小的一個鄰域Δx,那么,隨機變量X落在(x, x+Δx)內的概率約為f(x)Δx,即P(x<X<x+Δx)≈f(x)Δx。換句話說,概率密度f(x)是X落在x處“單位寬度”內的概率。“密
度”一詞可以由此理解。
1. 概率密度函數
假設有一元隨機變量X,如果X是連續隨機變量,那么可以定義它的概率
密度函數(probability density function, PDF) f(x),有時成為密度函數。

在數學中,連續型隨機變量的概率密度函數(在不至於混淆時可以簡稱為密度函數)是一個描述這個隨機變量的輸出值,在某個確定的取值點附近的可能性的函數。 它本身不是一個概率值, 可以大於1. 在xx上積分后才是概率值。
我們用PDF在某一區間上的積分來刻畫隨機變量落在這個區間中的概率,即


2. 概率質量函數
如果X是離散型隨機變量,那么可以定義它的概率質量函數(probability mass function, PMF)pX(x)。概率質量函數 (Probability Mass Function,PMF)是離散隨機變量在各特定取值上的概率。即,它本身就是一個概率值**。
與連續型隨機變量不同,這里的PMF其實就是高中所學的離散型隨機變量的分布律,即

比如對於擲一枚均勻硬幣,如果正面令X=1,如果反面令X= 0。那么它的PMF就是

概率密度函數用數學公式表示就是一個定積分的函數,定積分在數學中是用來求面積的,而在這里,你就把概率表示為面積即可!
image.png
左邊是F(x)連續型隨機變量分布函數畫出的圖形,右邊是f(x)連續型隨機變量的概率密度函數畫出的圖像,它們之間的關系就是,概率密度函數是分布函數的導函數。
兩張圖一對比,你就會發現,如果用右圖中的面積來表示概率,利用圖形就能很清楚的看出,哪些取值的概率更大!所以,我們在表示連續型隨機變量的概率時,用f(x)概率密度函數來表示,是非常好的!
但是,可能讀者會有這樣的問題:
Q:概率密度函數在某一點的值有什么意義?
A:比較容易理解的意義,某點的 概率密度函數 即為 概率在該點的變化率(或導數)。很容易誤以為 該點概率密度值 為 概率值.
比如: 距離(概率)和速度(概率密度)的關系.
某一點的速度, 不能以為是某一點的距離
沒意義,因為距離是從XX到XX的概念
所以, 概率也需要有個區間.
這個區間可以是x的鄰域(可以無限趨近於0)。對x鄰域內的f(x)進行積分,可以求得這個鄰域的面積,就代表了這個鄰域所代表這個事件發生的概率。
3. 累積分布函數
而不管X是什么類型(連續/離散/其他)的隨機變量,都可以定義它的累積分布函數(cumulative distribution function ,CDF)FX(x),有時簡稱為分布函數。
CDF的定義是:

對於連續型隨機變量,顯然有

,那么分布函數CDF(FX(x))就是密度函數PDF(fX(t))的積分,PDF就是CDF的導數。
對於離散型隨機變量,其CDF是階梯狀的分段函數,比如舉例中的擲硬幣隨機變量,它的CDF如下

另外CDF的單調遞增(不減)性質可以由它的定義和概率的性質推出,因為對任意x1<x2,總有

,所以

4. 常用概率密度函數
正態分布是重要的概率分布。它的概率密度函數是:


隨着參數μ和δ變化,概率分布也產生變化。

X的 方差為

更廣泛的說,設g 為一個 有界 連續函數,那么隨機變量g(X)的數學期望


特征函數與概率密度函數有一對一的關系。因此,知道一個分布的特征函數就等同於知道一個分布的概率密度函數。
作者:starmier
鏈接:https://www.jianshu.com/p/9be87c903ff1
來源:簡書
著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請注明出處。