如何通俗理解泊松分布?(轉)


如何通俗理解泊松分布?(轉)

一、總結

一句話總結:

泊松分布就是把時間段分細,用二次分布來計算每個時間段事情是否發生,然后求極限就會得到泊松分布的式子 P(N(t)=n) = (λt)^n*e^(-λt)/n!

 

 

二、如何通俗理解泊松分布?(轉)

轉自:如何通俗理解泊松分布?
https://blog.csdn.net/ccnt_2012/article/details/81114920

1 甜在心饅頭店

公司樓下有家饅頭店:

 

 

每天早上六點到十點營業,生意挺好,就是發愁一個事情,應該准備多少個饅頭才能既不浪費又能充分供應?

老板統計了一周每日賣出的饅頭(為了方便計算和講解,縮小了數據):

 

 

均值為:

 

 

 

按道理講均值是不錯的選擇(參見如何理解最小二乘法?),但是如果每天准備5個饅頭的話,從統計表來看,至少有兩天不夠賣,40\% 的時間不夠賣:

 

 

你“甜在心饅頭店”又不是小米,搞什么飢餓營銷啊?老板當然也知道這一點,就拿起紙筆來開始思考。

2 老板的思考

老板嘗試把營業時間抽象為一根線段,把這段時間用 T 來表示:

 

 

然后把周一的三個饅頭(“甜在心饅頭”,有褶子的饅頭)按照銷售時間放在線段上:

 

 

T 均分為四個時間段:

 

 

此時,在每一個時間段上,要不賣出了(一個)饅頭,要不沒有賣出:

 

 

在每個時間段,就有點像拋硬幣,要不是正面(賣出),要不是反面(沒有賣出):

 

T 內賣出3個饅頭的概率,就和拋了4次硬幣(4個時間段),其中3次正面(賣出3個)的概率一樣了。

這樣的概率通過二項分布來計算就是:

 

 

但是,如果把周二的七個饅頭放在線段上,分成四段就不夠了:

 

 

從圖中看,每個時間段,有賣出3個的,有賣出2個的,有賣出1個的,就不再是單純的“賣出、沒賣出”了。不能套用二項分布了。

解決這個問題也很簡單,把 T 分為20個時間段,那么每個時間段就又變為了拋硬幣:

 

 

這樣,T 內賣出7個饅頭的概率就是(相當於拋了20次硬幣,出現7次正面):

 

 

為了保證在一個時間段內只會發生“賣出、沒賣出”,干脆把時間切成 n 份:

 

 

越細越好,用極限來表示:

 

 

更抽象一點,T 時刻內賣出 k 個饅頭的概率為:

 

 

3 p 的計算

“那么”,老板用筆敲了敲桌子,“只剩下一個問題,概率 p 怎么求?”

在上面的假設下,問題已經被轉為了二項分布。二項分布的期望為:

 

 

那么:

 

 

4 泊松分布

有了 了之后,就有:

 

 

我們來算一下這個極限:

 

 

其中:

 

 

 

 

 

所以:

 

 

上面就是泊松分布的概率密度函數,也就是說,在 T 時間內賣出 k 個饅頭的概率為:

 

 

一般來說,我們會換一個符號,讓 \mu=\lambda ,所以:

 

 

這就是教科書中的泊松分布的概率密度函數。

5 饅頭店的問題的解決

老板依然蹙眉,不知道 \mu 啊?

沒關系,剛才不是計算了樣本均值:

 

 

可以用它來近似:

 

 

於是:

 

 

畫出概率密度函數的曲線就是:

 

 

可以看到,如果每天准備8個饅頭的話,那么足夠賣的概率就是把前8個的概率加起來:

 

 

這樣 93\% 的情況夠用,偶爾賣缺貨也有助於品牌形象。

老板算出一腦門的汗,“那就這么定了!”

6 二項分布與泊松分布

鑒於二項分布與泊松分布的關系,可以很自然的得到一個推論,當二項分布的 p 很小的時候,兩者比較接近:

 

 

7 總結

這個故事告訴我們,要努力學習啊,要不以后饅頭都沒得賣。

生活中還有很多泊松分布。比如物理中的半衰期,我們只知道物質衰變一半的時間期望是多少,但是因為不確定性原理,我們沒有辦法知道具體哪個原子會在什么時候衰變?所以可以用泊松分布來計算。

還有比如交通規划等等問題。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM