首先我們需要搞清楚幾個概念:概率函數、概率分布、概率密度
我這里只做簡單闡述,意在理解概念,可能不嚴謹。
我們知道變量可分為離散隨機變量和連續隨機變量;
概率函數:隨機變量取某個值的概率
pi=P(X=ai)(i=1,2,3,4,5,6);以骰子為例,每次搖骰子取值為 1-6,取每個數字的概率為 1/6,這就是離散概率函數;
pi=P(X<170);以身高為例,小於 170 的概率,這就是連續概率函數
描述了取某個值或者某一個區間的概率
概率分布:也叫累積概率函數,隨機變量取某些值的概率,也就是取這些值的概率的累加和
pi=P(X=[1, 2])
pi=P(X<170 and X>165)
描述了取某些值或某些區間的概率
概率密度:它只針對連續型隨機變量,連續型隨機變量的概率函數也叫概率密度
數學上用如下公式表示概率密度
可以看到 X 的取值是連續的,P 是一個積分
F(x) 左圖表示連續型隨機變量的概率分布;f(x) 右圖表示連續型隨機變量的概率密度;
f(x) 是 F(x) 的導數
均勻分布
應該說是最簡單的分布,它是指在一個取值范圍內取到每個值的概率相等;
對於離散型隨機變量,概率函數為
P(X)=1/a-b a<b 代表取值范圍
對於連續型隨機變量,就是可以等概率地取 a b 之間的任一個數
期望:u=(a+b)/2;方差:var=(a-b)2/12
擴展
它適用於連續型變量和離散型變量
場景描述
投骰子
高斯分布
也叫正態分布,是最常見的分布,世界上大部分數據應該是滿足高斯分布的,其圖形如下
均勻的分布在某點兩側,當然沒那么平滑也算高斯,大部分沒這么平滑
伯努利分布
也叫兩點分布;
稍微官方的概念:在相同條件下重復 n 次試驗,如果每次試驗只有兩個相對立的事件,且各次試驗中發生的概率不變,我們成這樣的試驗為 n 重伯努利試驗
通俗解釋:只有兩個結果的事件;如拋硬幣
我們一般把結果即為 {0, 1},如拋硬幣 0 是反面,1 是正面;
而且我們通常把 1 發生的概率記為 P(x=1) = p,那么 0 發生的概率則為 P(x=0) = 1-p;
那么 x 的概率可記為 P(x) = px(1-p)1-x (x 取值 0,1 )
說的官方點,x 服從參數為 p 的伯努利分布
期望:E(x) = p;方差:var(x) = p(1-p)
擴展
1. 伯努利分布是離散型分布
2. 邏輯回歸二分類就是伯努利分布
場景描述
拋一次硬幣
二項分布
接着 伯努利分布 講,我們做 n 次獨立實驗得到 結果集 D, 其中正面朝上的事件發生了 x 次,如果 n 為 1,就是伯努利分布,如果 n 大於 1,則為二項分布,其概率函數為
p 為每次正面朝上的概率
期望:E(x) = np;方差:var(x) = np(1-p)
擴展
1. 二項分布也是離散型分布
2. 還以 邏輯回歸 為例,如果只有一個模型,結果服從 伯努利分布; 如果進行有放回的抽樣,訓練 多個模型,則結果服從 二項分布;這里是不是有點像 bagging?
3. 當 p = 1 - p,即 p = 0.5 時,二項分布的直方圖(或者概率條形圖)是對稱的,很容易理解,或者舉個例子帶入公式也可理解
4. 當 n 趨近於無窮大時,二項分布近似等於正態分布,也就是說,正態分布是二項分布的極限
場景描述
拋 n 次硬幣,當我們拋了無窮多次,那不就是正態分布嗎
泊松分布
適合描述單位時間(空間)內隨機事件發生的次數
比如有 100 個人,其中有 1 個男性的概率?有 2 個男性的概率? 假如我有個先驗知識,所有人中男性的占比為 60%,就能計算有 k 個男性的概率
λ 即為先驗概率, k 為發生次數
期望和方差都是 λ
擴展
1. 從定義來看,好像和 二項分布 差不多啊,他們之間確實有關系;
從概念上講,泊松分布適合實驗次數多,且單位時間發生的概率很低的情況,如交通事故;
當 n 很大 p 很小時,二項分布近似等於泊松分布,其中 λ 為 np
從數學上講,二項分布可以推導出泊松分布
2. 泊松分布可以近似地看成離散變量的高斯分布
場景描述
泊松分布適合於描述單位時間(或空間)內隨機事件發生的次數。如某一服務設施在一定時間內到達的人數,電話交換機接到呼叫的次數,汽車站台的候客人數,機器出現的故障數,自然災害發生的次數,一塊產品上的缺陷數,顯微鏡下單位分區內的細菌分布數等等
指數分布
接着 泊松分布 講,泊松分布用於單位時間內發生的次數,
但是如果發生了 0 次,也就是沒有發生,則泊松分布為 P(X=0)=e-λ;也就是說發生的概率是 P(X!=0)=1 - e-λ,發生而不管發生了多少次;
同時我們也可以把 發生了 x 次記為 發生,那么每次發生的概率 為 xλ,所以我們可以把指數分布擴展為
P(X<x) = e-xλ 沒發生
P(X>x) = 1 - e-xλ 發生
期望:u=1/λ;方差:var=1/λ2
擴展
1. 所以指數分布常用於會不會發生
2. 指數分布和泊松分布有一定聯系
場景描述
機器是否會故障
參考資料:
https://blog.csdn.net/u014296502/article/details/81069042
https://blog.csdn.net/lin360580306/article/details/51228966
http://www.raincent.com/content-10-10914-1.html
https://blog.csdn.net/weixin_44355973/article/details/98473503
https://baike.baidu.com/item/%E6%B3%8A%E6%9D%BE%E5%88%86%E5%B8%83/1442110?fr=aladdin