概率論中PDF、PMF和CDF的區別與聯系
一、總結
一句話總結:
PDF:概率密度函數(probability density function), 在數學中,連續型隨機變量的概率密度函數(在不至於混淆時可以簡稱為密度函數)是一個描述這個隨機變量的輸出值,在某個確定的取值點附近的可能性的函數。
PMF:概率質量函數(probability mass function), 在概率論中,概率質量函數是離散隨機變量在各特定取值上的概率。
CDF:累積分布函數 (cumulative distribution function),又叫分布函數,是概率密度函數的積分,能完整描述一個實隨機變量X的概率分布。
1、PDF和PMF區別?
1、PDF是連續變量特有的,PMF是離散隨機變量特有的;
2、PDF的取值本身不是概率,它是一種趨勢(密度)只有對連續隨機變量的取值進行積分后才是概率,也就是說對於連續值確定它在某一點的概率是沒有意義的;
3、PMF的取值本身代表該值的概率。
二、概率論中PDF、PMF和CDF的區別與聯系
轉自或參考:概率論中PDF、PMF和CDF的區別與聯系_秦剛剛的博客-CSDN博客_pmf
https://blog.csdn.net/yzcjwddbdgg/article/details/88063677
在概率論中,經常出現PDF、PMF和CDF,那么這三者有什么區別與聯系呢?
1. 概念解釋
-
PDF:概率密度函數(probability density function), 在數學中,連續型隨機變量的概率密度函數(在不至於混淆時可以簡稱為密度函數)是一個描述這個隨機變量的輸出值,在某個確定的取值點附近的可能性的函數。
-
PMF : 概率質量函數(probability mass function), 在概率論中,概率質量函數是離散隨機變量在各特定取值上的概率。
-
CDF : 累積分布函數 (cumulative distribution function),又叫分布函數,是概率密度函數的積分,能完整描述一個實隨機變量X的概率分布。
2. 數學表示
2.1 PDF
如果XX是連續型隨機變量,定義概率密度函數為fX(x)fX(x),用PDF在某一區間上的積分來刻畫隨機變量落在這個區間中的概率,即

2.2 PMF
如果XX離散型隨機變量,定義概率質量函數為fX(x)fX(x),PMF其實就是高中所學的離散型隨機變量的分布律,即

比如對於擲一枚均勻硬幣,如果正面令X=1X=1,如果反面令X=0X=0,那么它的PMF就是

2.3 CDF
不管是什么類型(連續/離散/其他)的隨機變量,都可以定義它的累積分布函數,有時簡稱為分布函數。
對於連續型隨機變量,顯然有:
FX(x)=Pr(X≤x)=∫−∞xfX(t)dtF_X(x)=Pr(X\leq x)=\int _{-\infty }^{x}f_X(t) dtFX(x)=Pr(X≤x)=∫−∞xfX(t)dt
那么CDF就是PDF的積分,PDF就是CDF的導數。
對於離散型隨機變量,其CDF是分段函數,比如舉例中的擲硬幣隨機變量,它的CDF為:
FX(x)=Pr(X≤x){0if x<012if 0≤x<11if x≥1F_X(x)=Pr(X\leq x)\left\{ \begin{array}{rcl} 0 & & {if \ \ \ x <0 }\\ \frac{1}{2} & & {if \ \ \ 0\leq x<1}\\ 1 & & {if\ \ \ x\geq 1}\\ \end{array} \right. FX(x)=Pr(X≤x)⎩⎨⎧0211if x<0if 0≤x<1if x≥1
3.概念分析
根據上述,我們能得到以下結論:
- PDF是連續變量特有的,PMF是離散隨機變量特有的;
- PDF的取值本身不是概率,它是一種趨勢(密度)只有對連續隨機變量的取值進行積分后才是概率,也就是說對於連續值確定它在某一點的概率是沒有意義的;
- PMF的取值本身代表該值的概率。
4.分布函數的意義
我們從兩點來分析分布函數的意義:
4.1 為什么需要分布函數?
對於離散型隨機變量,可以直接用分布律來描述其統計規律性;而對於連續型隨機變量(非離散型的隨機變量),我們無法一一列舉出隨機變量的所有可能取值,所以它的概率分布不能像離散隨機變量那樣用分布律進行描述。於是引入PDF,用積分來求隨機變量落入某個區間的概率。
分布律(PMF)不能描述連續型隨機變量,密度函數(PDF)不能描述離散隨機變量,因此需要找到一個統一方式描述隨機變量統計規律,這就有了分布函數。
另外,在現實生活中,有時候人們感興趣的是隨機變量落入某個范圍內的概率是多少,如擲骰子的數小於3點的獲勝,那么考慮隨機變量落入某個區間的概率就變得有現實意義了,因此引入分布函數很有必要。
4.2 分布函數的意義
分布函數F(x)F(x)F(x)在點xxx處的函數值表示XXX落在區間(−∞,x](−\infty,x](−∞,x]內的概率,所以分布函數就是定義域為RRR的一個普通函數,因此我們可以把概率問題轉化為函數問題,從而可以利用普通的函數知識來研究概率問題,增大了概率的研究范圍。
5.參考文獻
概率中的PDF,PMF,CDF
http://www.dataguru.cn/thread-150756-1-1.html
https://www.zhihu.com/question/23022012
https://www.zhihu.com/question/36853661
https://www.zhihu.com/question/21911186
http://wenku.baidu.com/view/823a0bb9f111f18582d05a14.html