泊松分布 & 指數分布


一、泊松分布

日常生活中,大量事件是有固定頻率的

  • 某醫院平均每小時出生3個嬰兒

  • 某公司平均每10分鍾接到1個電話

  • 某超市平均每天銷售4包xx牌奶粉

  • 某網站平均每分鍾有2次訪問

它們的特點就是,我們可以預估這些事件的總數,但是沒法知道具體的發生時間。已知平均每小時出生3個嬰兒,請問下一個小時,會出生幾個?

有可能一下子出生6個,也有可能一個都不出生。這是我們沒法知道的。

泊松分布就是描述某段時間內,事件具體的發生概率。

上面就是泊松分布的公式。等號的左邊,P 表示概率N表示某種函數關系,t 表示時間,n 表示數量,1小時內出生3個嬰兒的概率,就表示為 P(N(1) = 3) 。等號的右邊,λ 表示事件的頻率。

接下來兩個小時,一個嬰兒都不出生的概率是0.25%,基本不可能發生。

接下來一個小時,至少出生兩個嬰兒的概率是80%。

泊松分布的圖形大概是下面的樣子。

可以看到,在頻率附近,事件的發生概率最高,然后向兩邊對稱下降,即變得越大和越小都不太可能。每小時出生3個嬰兒,這是最可能的結果,出生得越多或越少,就越不可能。

 

泊松分布使用范圍

Poisson分布主要用於描述在單位時間(空間)中稀有事件的發生數. 即需滿足以下四個條件:

1、給定區域內的特定事件產生的次數,可以是根據時間,長度,面積來定義;

2、各段相等區域內的特定事件產生的概率是一樣的;

3、各區域內,事件發生的概率是相互獨立的;

4、當給定區域變得非常小時,兩次以上事件發生的概率趨向於0。

例如:

1、放射性物質在單位時間內的放射次數;

2、在單位容積充分搖勻的水中的細菌數;

3、野外單位空間中的某種昆蟲數等。

 

泊松分布的期望和方差

由泊松分布知E[N(t) − N(t0)] = D[N(t) − N(t0)] = λ(t − t0)

特別的,令t_0=0.由於假設N(0)=0,故可推知泊松過程的均值函數和方差函數分別為E[N(t)] = λt,D[N(t)] = λt,

泊松過程的強度lambda (常數)等於單位長時間間隔內出現的質點數目的期望值。即對泊松分布有:E(X) = D(X) = λ

 

泊松分布的特征

1、泊松分布是一種描述和分析稀有事件的概率分布。要觀察到這類事件,樣本含量n必須很大。

2、λ是泊松分布所依賴的唯一參數。λ值愈小,分布愈偏倚,隨着λ的增大,分布趨於對稱。

3、當λ = 20時,分布泊松接近於正態分布;當λ = 50時,可以認為泊松分布呈正態分布。在實際工作中,當時就可以用正態分布來近似地處理泊松分布的問題。

 

二、指數分布

指數分布是事件的時間間隔的概率。下面這些都屬於指數分布。

  • 嬰兒出生的時間間隔

  • 來電的時間間隔

  • 奶粉銷售的時間間隔

  • 網站訪問的時間間隔

指數分布的公式可以從泊松分布推斷出來。如果下一個嬰兒間隔時間 t ,就等同於 t 之內沒有任何嬰兒出生。

反過來,事件在時間 t 之內發生的概率(至少出生一個的概率),就是1減去上面的值。

接下來15分鍾,會有嬰兒出生的概率是52.76%。

接下來的15分鍾到30分鍾,會有嬰兒出生的概率是24.92%。

指數分布的圖形大概是下面的樣子。

可以看到,隨着間隔時間變長,事件的發生概率急劇下降,呈指數式衰減。想一想,如果每小時平均出生3個嬰兒,上面已經算過了,下一個嬰兒間隔2小時才出生的概率是0.25%,那么間隔3小時、間隔4小時的概率,是不是更接近於0?

 

指數分布的概率密度為:

 

式中:x是給定的時間;λ為單位時間事件發生的次數;e=2.71828。

 

指數分布概率密度曲線如下圖:

 

 

指數分布具有以下特征:

(1)隨機變量X的取值范圍是從0到無窮;

(2)極大值在x=0處,即f(x)=λ;

(3)函數為右偏,且隨着x的增大,曲線穩步遞減;

(4)隨機變量的期望值和方差為µ=1/λ,σ2=1/λ2

 

 

通過對概率密度函數的積分,就可以得到相應的概率,其表達式有兩種

P(X≥x)=e-λx

P(X≤x)=1-e-λx

 

例:某電視機生產廠生產的電視機平均10年出現大的故障,且故障發生的次數服從泊松分布。

問(1)該電視機使用15年后還沒有出現大故障的比例;(2)如果廠家想提供大故障免費維修的質量擔保,但不能超過全部產量的20%,試確定提供擔保的年數。

 

解:

(1)設X為電視機出現大故障的時間。已知µ=10年,則λ=1/µ=0.1,於是,P(X≥x)=e-λx=e-0.1*15≈0.223。則15年后,沒有出現大故障的電視機約占22.3%。

(2)問題要求比例不超過20%,這是求X的右側概率面積,現在根據公式確定適當的X值。

 

電視機各年累計出現的故障比例

擔保年數X

累計概率P(X≤x)=1-e-λx

1

0.095

2

0.181

3

0.259

從表中可以看到:擔保2年時,出現大故障的比例是18.1%,不超過20%。擔保3年時,出現大故障的比例為25.9%,已經超過20%。所以,廠家應以2年為擔保期。

 

 

泊松分布是二項式分布的細分,當n→∞,p非常小的時候。

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM