二項分布


目錄:

  1. 定義
  2. 期望與方差
  3. 兩個二項分布的協方差
  4. python畫圖
  5. 二項分布與其他分布的關系

一、定義

在n次獨立重復的伯努利試驗中,設每次試驗中事件A發生的概率為p。用 表示n重伯努利試驗中事件A發生的次數,則X的可能取值為0,1,…,n,且對每一個k(0≤k≤n),事件{X=k}即為“n次試驗中事件A恰好發生k次”,隨機變量 的離散概率分布即為二項分布(Binomial Distribution)。

在概率論和統計學中,二項分布是n個獨立的成功/失敗試驗中成功的次數的離散概率分布,其中每次試驗的成功概率為p。這樣的單次成功/失敗試驗又稱為伯努利試驗。實際上,當n=1時,二項分布就是伯努利分布

一般地,如果隨機變量 X 服從參數為 np 的二項分布,我們記為 X~B(n,p)  或  X~b(n,p) 。n 次試驗中正好得到 k 次成功的概率由概率質量函數給出:

式中k=0,1,2...,n, 

是二項分布,又記為Cnk     該公式可以用以下方法理解:我們希望有k次成功(p)和n−k次失敗(1 −p)。並且,k次成功可以在n次試驗的任何地方出現,而把k次成功分布在n次試驗中共有Cnk   個不同的方法

 

二、期望與方差

如果 X~B(n,p)(也就是說,X是服從二項分布的隨機變量),那么X的期望為:

 

 

X的方差為:

 

 

 

 

這個事實很容易證明。首先假設有一個伯努利試驗。試驗有兩個可能的結果:1和0,前者發生的概率為p,后者的概率為1−p。該試驗的期望值等於μ= 1 * p+ 0  * (1−p) =p。該試驗的方差,也可以類似地計算:σ2= (1−μ)2 p+ (0−μ)2 (1−p) =p(1 − p)
一般的二項分布是n次獨立的伯努利試驗的和。它的期望值和方差分別等於每次單獨試驗的期望值和方差的和:

 

 

 三、兩個二項分布的協方差

如果有兩個服從二項分布的隨機變量X和Y,我們可以求它們的協方差。利用協方差的定義,當n= 1時我們有:

 

 

E(XY)為當X和Y都等於1時的概率,而E(X)和E(Y)分別為X= 1和Y= 1的概率。定義P,B為X和Y都等於1的概率,便得到:

 

 

對於n次獨立的試驗,我們便有:

 

 

如果X和Y是相同的變量,便化為前文所述的的二項分布方差公式

 

 

四、python畫圖
import matplotlib.pyplot as plt
import numpy as np
from scipy import stats

#二項分布
n=100
p=0.3
k=np.arange(0,n)#生成一個0到N-1的數列
y1=stats.binom.pmf(k,n,p)
plt.plot(k,y1)
plt.show()

###畫泊松分布的圖
m=n*p
y2=stats.poisson.pmf(k,m)
plt.plot(k,y2,'g^-')
plt.show()

###再畫個正態分布的圖
l=np.sqrt(m)
y3=stats.norm.pdf(k,m,l)
plt.plot(k,y3,'ro-')
plt.show()

#畫完三個圖之后就把他們放一下對比一下吧,為了方便改變參數,我們把它寫成一個函數吧。
def draw(times,possibility):
    import matplotlib.pyplot as plt
    import numpy as np
    from scipy import stats
    n=times
    p=possibility
    k=np.arange(0,n)#生成一個0到N-1的數列
    y1=stats.binom.pmf(k,n,p)
    m=n*p#確定泊松分布的參數
    y2=stats.poisson.pmf(k,m)
    l=np.sqrt(m)#確定正態分布的另一個參數
    y3=stats.norm.pdf(k,m,l)#注意一下前兩個是pmf最后一個是pdf
    plt.xlabel('k')
    plt.ylabel('possibility')
    plt.title('three distribution :n=%d  p=%.2f' % (n,p) )#用到了python的格式化
    binomial=plt.plot(k,y1,color='r',label='binomial')
    poisson=plt.plot(k,y2,color='g',label='poisson')
    normal=plt.plot(k,y3,color='b',label='normal')#對圖的參數進行調整
    plt.legend(loc='upper right')#把圖例放在右上角
    plt.show()

draw(100,0.3)

 

從上圖中可以看出,對於固定的n以及p,當k增加時,概率P{X=k}先是隨之增加直至達到最大值,隨后單調減少。可以證明,一般的二項分布也具有這一性質,且: 

  1. 當(n+1)p不為整數時,二項概率P{X=k}在k=[(n+1)p]時達到最大值;
  2. 當(n+1)p為整數時,二項概率P{X=k}在k=(n+1)p和k=(n+1)p-1時達到最大值。

注:[x]為取整函數,即為不超過x的最大整數

 

五、二項分布與其他分布的關系

兩個二項分布的和

如果X~ B(n,p)和Y~ B(m,p),且X和Y相互獨立,那么X+Y也服從二項分布;它的分布為:

伯努利分布
伯努利分布是二項分布在n= 1時的特殊情況。X~ B(1,p)與X~ Bern(p)的意思是相同的。相反,任何二項分布B(n,p)都是n次獨立伯努利試驗的和,每次試驗成功的概率為p
泊松近似
當試驗的次數趨於無窮大,而乘積np固定時,二項分布收斂於泊松分布。因此參數為λ=np的泊松分布可以作為二項分布B(n,p)的近似,近似成立的前提要求n足夠大,而p足夠小,np不是很小
正態近似
如果n足夠大,那么分布的偏度就比較小。在這種情況下,如果使用適當的連續性校正,那么B(n,p)的一個很好的近似是正態分布:

當n越大(至少20)且p不接近0或1時近似效果更好。不同的經驗法則可以用來決定n是否足夠大,以及p是否距離0或1足夠遠,其中一個常用的規則是np和n(1 −p)都必須大於 5

 

 回到頂部

 

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM