一、泊松分布
日常生活中,大量事件是有固定頻率的。
某醫院平均每小時出生3個嬰兒
某公司平均每10分鍾接到1個電話
某超市平均每天銷售4包xx牌奶粉
某網站平均每分鍾有2次訪問
它們的特點就是,我們可以預估這些事件的總數,但是沒法知道具體的發生時間。已知平均每小時出生3個嬰兒,請問下一個小時,會出生幾個?
有可能一下子出生6個,也有可能一個都不出生。這是我們沒法知道的。
泊松分布就是描述某段時間內,事件具體的發生概率。
上面就是泊松分布的公式。等號的左邊,P 表示概率,N表示某種函數關系,t 表示時間,n 表示數量,1小時內出生3個嬰兒的概率,就表示為 P(N(1) = 3) 。等號的右邊,λ 表示事件的頻率。
接下來兩個小時,一個嬰兒都不出生的概率是0.25%,基本不可能發生。
接下來一個小時,至少出生兩個嬰兒的概率是80%。
泊松分布的圖形大概是下面的樣子。
可以看到,在頻率附近,事件的發生概率最高,然后向兩邊對稱下降,即變得越大和越小都不太可能。每小時出生3個嬰兒,這是最可能的結果,出生得越多或越少,就越不可能。
泊松分布使用范圍
Poisson分布主要用於描述在單位時間(空間)中稀有事件的發生數. 即需滿足以下四個條件:
1、給定區域內的特定事件產生的次數,可以是根據時間,長度,面積來定義;
2、各段相等區域內的特定事件產生的概率是一樣的;
3、各區域內,事件發生的概率是相互獨立的;
4、當給定區域變得非常小時,兩次以上事件發生的概率趨向於0。
例如:
1、放射性物質在單位時間內的放射次數;
2、在單位容積充分搖勻的水中的細菌數;
3、野外單位空間中的某種昆蟲數等。
泊松分布的期望和方差
由泊松分布知E[N(t) − N(t0)] = D[N(t) − N(t0)] = λ(t − t0)
特別的,令t_0=0.由於假設N(0)=0,故可推知泊松過程的均值函數和方差函數分別為E[N(t)] = λt,D[N(t)] = λt,
泊松過程的強度lambda (常數)等於單位長時間間隔內出現的質點數目的期望值。即對泊松分布有:E(X) = D(X) = λ
泊松分布的特征
1、泊松分布是一種描述和分析稀有事件的概率分布。要觀察到這類事件,樣本含量n必須很大。
2、λ是泊松分布所依賴的唯一參數。λ值愈小,分布愈偏倚,隨着λ的增大,分布趨於對稱。
3、當λ = 20時,分布泊松接近於正態分布;當λ = 50時,可以認為泊松分布呈正態分布。在實際工作中,當時就可以用正態分布來近似地處理泊松分布的問題。
二、指數分布
指數分布是事件的時間間隔的概率。下面這些都屬於指數分布。
嬰兒出生的時間間隔
來電的時間間隔
奶粉銷售的時間間隔
網站訪問的時間間隔
指數分布的公式可以從泊松分布推斷出來。如果下一個嬰兒間隔時間 t ,就等同於 t 之內沒有任何嬰兒出生。
反過來,事件在時間 t 之內發生的概率(至少出生一個的概率),就是1減去上面的值。
接下來15分鍾,會有嬰兒出生的概率是52.76%。
接下來的15分鍾到30分鍾,會有嬰兒出生的概率是24.92%。
指數分布的圖形大概是下面的樣子。
可以看到,隨着間隔時間變長,事件的發生概率急劇下降,呈指數式衰減。想一想,如果每小時平均出生3個嬰兒,上面已經算過了,下一個嬰兒間隔2小時才出生的概率是0.25%,那么間隔3小時、間隔4小時的概率,是不是更接近於0?
指數分布的概率密度為:
式中:x是給定的時間;λ為單位時間事件發生的次數;e=2.71828。
指數分布概率密度曲線如下圖:
指數分布具有以下特征:
(1)隨機變量X的取值范圍是從0到無窮;
(2)極大值在x=0處,即f(x)=λ;
(3)函數為右偏,且隨着x的增大,曲線穩步遞減;
(4)隨機變量的期望值和方差為µ=1/λ,σ2=1/λ2。
通過對概率密度函數的積分,就可以得到相應的概率,其表達式有兩種
P(X≥x)=e-λx
P(X≤x)=1-e-λx
例:某電視機生產廠生產的電視機平均10年出現大的故障,且故障發生的次數服從泊松分布。
問(1)該電視機使用15年后還沒有出現大故障的比例;(2)如果廠家想提供大故障免費維修的質量擔保,但不能超過全部產量的20%,試確定提供擔保的年數。
解:
(1)設X為電視機出現大故障的時間。已知µ=10年,則λ=1/µ=0.1,於是,P(X≥x)=e-λx=e-0.1*15≈0.223。則15年后,沒有出現大故障的電視機約占22.3%。
(2)問題要求比例不超過20%,這是求X的右側概率面積,現在根據公式確定適當的X值。
電視機各年累計出現的故障比例 |
|
擔保年數X |
累計概率P(X≤x)=1-e-λx |
1 |
0.095 |
2 |
0.181 |
3 |
0.259 |
從表中可以看到:擔保2年時,出現大故障的比例是18.1%,不超過20%。擔保3年時,出現大故障的比例為25.9%,已經超過20%。所以,廠家應以2年為擔保期。
泊松分布是二項式分布的細分,當n→∞,p非常小的時候。