目錄:
一、定義
在n次獨立重復的伯努利試驗中,設每次試驗中事件A發生的概率為p。用 X 表示n重伯努利試驗中事件A發生的次數,則X的可能取值為0,1,…,n,且對每一個k(0≤k≤n),事件{X=k}即為“n次試驗中事件A恰好發生k次”,隨機變量 X 的離散概率分布即為二項分布(Binomial Distribution)。
在概率論和統計學中,二項分布是n個獨立的成功/失敗試驗中成功的次數的離散概率分布,其中每次試驗的成功概率為p。這樣的單次成功/失敗試驗又稱為伯努利試驗。實際上,當n=1時,二項分布就是伯努利分布
一般地,如果隨機變量 X 服從參數為 n 和 p 的二項分布,我們記為 X~B(n,p) 或 X~b(n,p) 。n 次試驗中正好得到 k 次成功的概率由概率質量函數給出:

式中k=0,1,2...,n,

是二項分布,又記為Cnk 該公式可以用以下方法理解:我們希望有k次成功(p)和n−k次失敗(1 −p)。並且,k次成功可以在n次試驗的任何地方出現,而把k次成功分布在n次試驗中共有Cnk 個不同的方法
二、期望與方差
如果 X~B(n,p)(也就是說,X是服從二項分布的隨機變量),那么X的期望為:

X的方差為:

這個事實很容易證明。首先假設有一個伯努利試驗。試驗有兩個可能的結果:1和0,前者發生的概率為p,后者的概率為1−p。該試驗的期望值等於μ= 1 * p+ 0 * (1−p) =p。該試驗的方差,也可以類似地計算:σ2= (1−μ)2 p+ (0−μ)2 (1−p) =p(1 − p)
一般的二項分布是n次獨立的伯努利試驗的和。它的期望值和方差分別等於每次單獨試驗的期望值和方差的和:

三、兩個二項分布的協方差
如果有兩個服從二項分布的隨機變量X和Y,我們可以求它們的協方差。利用協方差的定義,當n= 1時我們有:

E(XY)為當X和Y都等於1時的概率,而E(X)和E(Y)分別為X= 1和Y= 1的概率。定義P,B為X和Y都等於1的概率,便得到:

對於n次獨立的試驗,我們便有:

如果X和Y是相同的變量,便化為前文所述的的二項分布方差公式
四、python畫圖
import matplotlib.pyplot as plt import numpy as np from scipy import stats #二項分布 n=100 p=0.3 k=np.arange(0,n)#生成一個0到N-1的數列 y1=stats.binom.pmf(k,n,p) plt.plot(k,y1) plt.show() ###畫泊松分布的圖 m=n*p y2=stats.poisson.pmf(k,m) plt.plot(k,y2,'g^-') plt.show() ###再畫個正態分布的圖 l=np.sqrt(m) y3=stats.norm.pdf(k,m,l) plt.plot(k,y3,'ro-') plt.show() #畫完三個圖之后就把他們放一下對比一下吧,為了方便改變參數,我們把它寫成一個函數吧。 def draw(times,possibility): import matplotlib.pyplot as plt import numpy as np from scipy import stats n=times p=possibility k=np.arange(0,n)#生成一個0到N-1的數列 y1=stats.binom.pmf(k,n,p) m=n*p#確定泊松分布的參數 y2=stats.poisson.pmf(k,m) l=np.sqrt(m)#確定正態分布的另一個參數 y3=stats.norm.pdf(k,m,l)#注意一下前兩個是pmf最后一個是pdf plt.xlabel('k') plt.ylabel('possibility') plt.title('three distribution :n=%d p=%.2f' % (n,p) )#用到了python的格式化 binomial=plt.plot(k,y1,color='r',label='binomial') poisson=plt.plot(k,y2,color='g',label='poisson') normal=plt.plot(k,y3,color='b',label='normal')#對圖的參數進行調整 plt.legend(loc='upper right')#把圖例放在右上角 plt.show() draw(100,0.3)

從上圖中可以看出,對於固定的n以及p,當k增加時,概率P{X=k}先是隨之增加直至達到最大值,隨后單調減少。可以證明,一般的二項分布也具有這一性質,且:
- 當(n+1)p不為整數時,二項概率P{X=k}在k=[(n+1)p]時達到最大值;
- 當(n+1)p為整數時,二項概率P{X=k}在k=(n+1)p和k=(n+1)p-1時達到最大值。
注:[x]為取整函數,即為不超過x的最大整數
五、二項分布與其他分布的關系
兩個二項分布的和
如果X~ B(n,p)和Y~ B(m,p),且X和Y相互獨立,那么X+Y也服從二項分布;它的分布為:

伯努利分布
泊松近似
正態近似
當n越大(至少20)且p不接近0或1時近似效果更好。不同的經驗法則可以用來決定n是否足夠大,以及p是否距離0或1足夠遠,其中一個常用的規則是np和n(1 −p)都必須大於 5
