-
狄利克雷分布:
是一個多維分布,一個K 維狄利克雷分布的參數是一個K維向量
=[
…
],
狄利克雷分布的概率密度函數為:
——————————————————————1
其中 是變量,且
;
表示伽馬函數。在這里伽馬函數部分充當的是歸一化因子的作用。
我們把狄利克雷分布記作 。
2.分類分布(Categorical distribution),也叫離散分布(Discrete Distribution):
概率質量函數(分布列,相當於在連續分布中的概率密度函數)為:
,其中
——————————————————2
這個函數的意思就是,變量z取值為k的概率是。
記作。
3.多項式分布:
我們從中采樣N 次,把取值為k 的樣本個數記為
,那么隨機變量
服從參數為N和
的多項式分布(Multinomial Distribution),其概率質量函數為
————————————————————————3
由以上三個分布的概率質量函數,現在以狄利克雷分布為先驗(即讓離散分布和多項分布中的參數π服從狄利克雷分布),在有了N個觀測樣本之后參數π的后驗分布為:
————————————————————————4
比較得,π的先驗分布(式1)與后驗分布(式4)具有相同的形式不同的參數,所以我們說狄利克雷分布是離散分布和多項式分布的共軛先驗。
當我們觀察到更多的樣本時,只需更新后驗分布的參數便可得到新的后驗分布為而不需要對π的分布進行估計。這是以狄利克雷分布作為先驗的優勢所在。