如何通俗理解泊松分布?(轉)
一、總結
一句話總結:
泊松分布就是把時間段分細,用二次分布來計算每個時間段事情是否發生,然后求極限就會得到泊松分布的式子 P(N(t)=n) = (λt)^n*e^(-λt)/n!
二、如何通俗理解泊松分布?(轉)
轉自:如何通俗理解泊松分布?
https://blog.csdn.net/ccnt_2012/article/details/81114920
1 甜在心饅頭店
公司樓下有家饅頭店:

每天早上六點到十點營業,生意挺好,就是發愁一個事情,應該准備多少個饅頭才能既不浪費又能充分供應?
老板統計了一周每日賣出的饅頭(為了方便計算和講解,縮小了數據):

均值為:

按道理講均值是不錯的選擇(參見如何理解最小二乘法?),但是如果每天准備5個饅頭的話,從統計表來看,至少有兩天不夠賣,
的時間不夠賣:

你“甜在心饅頭店”又不是小米,搞什么飢餓營銷啊?老板當然也知道這一點,就拿起紙筆來開始思考。
2 老板的思考
老板嘗試把營業時間抽象為一根線段,把這段時間用
來表示:

然后把周一的三個饅頭(“甜在心饅頭”,有褶子的饅頭)按照銷售時間放在線段上:

把
均分為四個時間段:

此時,在每一個時間段上,要不賣出了(一個)饅頭,要不沒有賣出:

在每個時間段,就有點像拋硬幣,要不是正面(賣出),要不是反面(沒有賣出):
內賣出3個饅頭的概率,就和拋了4次硬幣(4個時間段),其中3次正面(賣出3個)的概率一樣了。
這樣的概率通過二項分布來計算就是:

但是,如果把周二的七個饅頭放在線段上,分成四段就不夠了:

從圖中看,每個時間段,有賣出3個的,有賣出2個的,有賣出1個的,就不再是單純的“賣出、沒賣出”了。不能套用二項分布了。
解決這個問題也很簡單,把
分為20個時間段,那么每個時間段就又變為了拋硬幣:

這樣,
內賣出7個饅頭的概率就是(相當於拋了20次硬幣,出現7次正面):

為了保證在一個時間段內只會發生“賣出、沒賣出”,干脆把時間切成
份:

越細越好,用極限來表示:

更抽象一點,
時刻內賣出
個饅頭的概率為:

3
的計算
“那么”,老板用筆敲了敲桌子,“只剩下一個問題,概率
怎么求?”
在上面的假設下,問題已經被轉為了二項分布。二項分布的期望為:

那么:

4 泊松分布
有了
了之后,就有:

我們來算一下這個極限:

其中:


所以:

上面就是泊松分布的概率密度函數,也就是說,在
時間內賣出
個饅頭的概率為:

一般來說,我們會換一個符號,讓
,所以:

這就是教科書中的泊松分布的概率密度函數。
5 饅頭店的問題的解決
老板依然蹙眉,不知道
啊?
沒關系,剛才不是計算了樣本均值:

可以用它來近似:

於是:

畫出概率密度函數的曲線就是:

可以看到,如果每天准備8個饅頭的話,那么足夠賣的概率就是把前8個的概率加起來:

這樣
的情況夠用,偶爾賣缺貨也有助於品牌形象。
老板算出一腦門的汗,“那就這么定了!”
6 二項分布與泊松分布
鑒於二項分布與泊松分布的關系,可以很自然的得到一個推論,當二項分布的
很小的時候,兩者比較接近:

7 總結
這個故事告訴我們,要努力學習啊,要不以后饅頭都沒得賣。
生活中還有很多泊松分布。比如物理中的半衰期,我們只知道物質衰變一半的時間期望是多少,但是因為不確定性原理,我們沒有辦法知道具體哪個原子會在什么時候衰變?所以可以用泊松分布來計算。
還有比如交通規划等等問題。
