去年12月,美國康涅狄格州發生校園槍擊案,造成28人死亡。
資料顯示,1982年至2012年,美國共發生62起(大規模)槍擊案。其中,2012年發生了7起,是次數最多的一年。
去年有這么多槍擊案,這是巧合,還是表明美國治安惡化了?
前幾天,我看到一篇很有趣的文章,使用"泊松分布"(Poisson distribution),判斷同一年發生7起槍擊案是否巧合。
讓我們先通過一個例子,了解什么是"泊松分布"。
例如:已知某家小雜貨店,平均每周售出2個水果罐頭。請問該店水果罐頭的最佳庫存量是多少?
假定不存在季節因素,可以近似認為,這個問題滿足以下三個條件:
(1)顧客購買水果罐頭是小概率事件。
(2)購買水果罐頭的顧客是獨立的,不會互相影響。
(3)顧客購買水果罐頭的概率是穩定的。
在統計學上,只要某類事件滿足上面三個條件,它就服從"泊松分布"。
泊松分布的公式如下:
各個參數的含義:
**P:每周銷售k個罐頭的概率。
X:水果罐頭的銷售變量。
k:X的取值(0,1,2,3...)。
λ:每周水果罐頭的平均銷售量,是一個常數,本題為2。**
根據公式,計算得到每周銷量的分布:
從上表可見,如果存貨4個罐頭,95%的概率不會缺貨(平均每19周發生一次);如果存貨5個罐頭,98%的概率不會缺貨(平均59周發生一次)。
案例2:
例有一繁忙的汽車站,每天有大量汽車通過,設每輛汽車,在一天的某段時間內出事故的概率為0.0001,在每天的該段時間內有1000 輛汽車通過,問出事故的次數不小於2的概率是多少?
設1000 輛車通過,出事故的次數為 X ,則X~b(1000,0.0001),
可利用泊松定理計算,λ=1000×0.0001=0.1
P{X≥2}≈1-e(-0.1)/0!-0.1×e(-0.1)/1!=0.0047
注意:
- λ是指平均發生的次數,即泊松分布中影響的唯一因子。第一個案例中,直接告訴了λ值,即平均賣的罐頭。第二個案例中,沒有直接給出平均值,但發生的概率和參與的樣本數。故平均值λ=樣本數*發生概率
- 第一個案例中求的是最佳庫存量,為泊松分布概率的累計概率,即缺貨概率。第二個案例中出的的發生次數小小於2的概率,即X大於或等於2的取值時的概率,因為總概率是1,將1-P(x=0)-P(x=1),即為題目所求的目標概率。
以下是泊松分布的代碼