多項分布是二項分布的推廣。二項分布(也叫伯努利分布)的典型例子是扔硬幣,硬幣正面朝上概率為p, 重復扔n次硬幣,k次為正面的概率即為一個二項分布概率。而多項分布就像扔骰子,有6個面對應6個不同的點數。二項分布時事件X只有2種取值,而多項分布的X有多種取值,多項分布的概率公式為
P(X1=x1,⋯,Xk=xk)={n!x1!,⋯,xk!px1⋯pxkwhen∑ki=1xi=n0otherwise.
這個公式看上去像是莫名其妙地冒出來的,想要了解它首先必須要知道組合數學中的多項式定理。
多項式定理:當n是一個正整數時,我們有
(x1+x2+…+xk)n=∑n!r1!r2!⋯rk!xr11…xrkk
其中r1+…+rk=n,ri≥0。
這個多項式定理的推導如下,將式子左邊展開
(x1+x2+…+xk)n=(x1+x2+…+xk)⋯(x1+x2+⋯+xk)
這樣的話,我們可以把問題看成在n個式子里,先選取r1個x1,然后選取r2個x2,最后選取rk個xk,然后求有多少種方法。類似把n個球放到k個不同的盒子里的方法有多少種,我們得到
Cr1,r2,…rkn=Cr1nCr2n−r1…Crkn−r1…−rk−1=n!r1!r2!…rk!
所以xr11xr22…xrkk的系數為Cr1,r2,…rkn,這樣,我們就能得到展開式的通式。舉個例子,當k=2時,我們就得到了常見的二項式公式:
(a+b)n=∑i=0nCinaibn−i
再來看之前的多項分布的概率公式,假設X1,X2,…,Xk發生的概率為p1,p2,…,pk,由於事件之間是相互獨立的,可得p1+p2+…+pk=1。 我們將p1+p2+…+pk=1式子的左邊看做一次抽樣各種事件發生的概率和,那么(p1+p2+…+pk)n=1n=1則是進行了n次抽樣所有事件相互組合的對應概率和。把這個多項式展開,它的每一項都對應着一個特殊事件的出現概率。我們把展開式的通項作為X1出現x1次,X2出現x2次,…,Xk出現xk次的這種事件的出現概率,這樣就得到了多項分布的概率公式。