一、定義

在n次獨立重復的伯努利試驗中，設每次試驗中事件A發生的概率為p。用 X 表示n重伯努利試驗中事件A發生的次數，則X的可能取值為0，1，…，n,且對每一個k（0≤k≤n）,事件{X=k}即為“n次試驗中事件A恰好發生k次”，隨機變量 X 的離散概率分布即為二項分布（Binomial Distribution）。

在概率論和統計學中，二項分布是n個獨立的成功/失敗試驗中成功的次數的離散概率分布，其中每次試驗的成功概率為p。這樣的單次成功/失敗試驗又稱為伯努利試驗。實際上，當n=1時，二項分布就是伯努利分布

一般地，如果隨機變量 X 服從參數為 n 和 p 的二項分布，我們記為 X~B(n,p) 或 X~b(n,p) 。n 次試驗中正好得到 k 次成功的概率由概率質量函數給出：

式中k=0，1，2...，n,

是二項分布，又記為C_n^k 該公式可以用以下方法理解：我們希望有k次成功(p)和n−k次失敗(1 −p)。並且，k次成功可以在n次試驗的任何地方出現，而把k次成功分布在n次試驗中共有C_n^k個不同的方法

二、期望與方差

如果 X~B(n,p)（也就是說，X是服從二項分布的隨機變量），那么X的期望為：

X的方差為：

這個事實很容易證明。首先假設有一個伯努利試驗。試驗有兩個可能的結果：1和0，前者發生的概率為p，后者的概率為1−p。該試驗的期望值等於μ= 1 * p+ 0 * (1−p) =p。該試驗的方差，也可以類似地計算：σ²= (1−μ)² p+ (0−μ)² (1−p) =p(1 − p)
一般的二項分布是n次獨立的伯努利試驗的和。它的期望值和方差分別等於每次單獨試驗的期望值和方差的和：

三、兩個二項分布的協方差

如果有兩個服從二項分布的隨機變量X和Y，我們可以求它們的協方差。利用協方差的定義，當n= 1時我們有：

E(XY)為當X和Y都等於1時的概率，而E(X)和E(Y)分別為X= 1和Y= 1的概率。定義P,B為X和Y都等於1的概率，便得到：

對於n次獨立的試驗，我們便有：

如果X和Y是相同的變量，便化為前文所述的的二項分布方差公式

四、python畫圖

import matplotlib.pyplot as plt
import numpy as np
from scipy import stats

#二項分布
n=100
p=0.3
k=np.arange(0,n)#生成一個0到N-1的數列
y1=stats.binom.pmf(k,n,p)
plt.plot(k,y1)
plt.show()

###畫泊松分布的圖
m=n*p
y2=stats.poisson.pmf(k,m)
plt.plot(k,y2,'g^-')
plt.show()

###再畫個正態分布的圖
l=np.sqrt(m)
y3=stats.norm.pdf(k,m,l)
plt.plot(k,y3,'ro-')
plt.show()

#畫完三個圖之后就把他們放一下對比一下吧,為了方便改變參數，我們把它寫成一個函數吧。
def draw(times,possibility):
    import matplotlib.pyplot as plt
    import numpy as np
    from scipy import stats
    n=times
    p=possibility
    k=np.arange(0,n)#生成一個0到N-1的數列
    y1=stats.binom.pmf(k,n,p)
    m=n*p#確定泊松分布的參數
    y2=stats.poisson.pmf(k,m)
    l=np.sqrt(m)#確定正態分布的另一個參數
    y3=stats.norm.pdf(k,m,l)#注意一下前兩個是pmf最后一個是pdf
    plt.xlabel('k')
    plt.ylabel('possibility')
    plt.title('three distribution :n=%d  p=%.2f' % (n,p) )#用到了python的格式化
    binomial=plt.plot(k,y1,color='r',label='binomial')
    poisson=plt.plot(k,y2,color='g',label='poisson')
    normal=plt.plot(k,y3,color='b',label='normal')#對圖的參數進行調整
    plt.legend(loc='upper right')#把圖例放在右上角
    plt.show()

draw(100,0.3)