一、指數族分布指的是概率密度函數都能夠表述成以下形式的概率分布。
其中fai(x)是充分統計量,A(ita)是對數配分函數。ita是規范化參數。【配分函數其實就是歸一化因子的概念,為了使概率滿足概率總和為1的約束】
指數族分布包括Gauss分布,bernoulli分布(0,1分布),beta分布,gamma分布,二項分布(多項式分布),Dirichlet分布等。這些分布的概率密度函數都可以表示成上圖中式子的形式。
對數配分函數的推導
舉例將高斯分布的概率密度函數用指數族分布的形式表達如下:
三、指數族分布有三個重要性質,分別是充分統計量、共軛、最大熵。
①關於充分統計量:(sufficient statistic)的理解:比如高斯分布中的{均值、方差}就是一組充分統計量,通過{均值,方差}我們就能得到這一組數據的大部分信息。(待確定)
不僅是{均值,方差},也可以是{sum(xi),sum(xi)^2}...,【查找相關統計概念】
充分統計量“充分”指的就是參數組{ ..}包含的原始數據的信息足夠多,可以用於壓縮數據。
“統計量”指的就是數學意義上一組數據的統計量,比如均值,方差...。
②關於共軛:是通過似然和先驗的共軛關系,將先驗的分布與后驗的分布聯系起來。如果似然和先驗共軛,那么后驗的分布與先驗的分布是同一種分布。
③關於最大熵:【待定:對未知參數的估計,往最隨機的方向假定。】
四、指數族分布中A(ita)和fai(x)的關系、A'(ita)和fai(x)的關系
①:A'(ita)和fai(x)的關系
式①:配分函數Z(也叫作歸一化因子)
A'(ita)和fai(x)的關系: A'(ita)=E(fai(x)),條件是p(x|ita)。
②由極大似然的想法推出 g_MLE=1/N(sum(fai(xi)))。
即從樣本的充分統計量進行求和平均,就能得到參數向量值 g_mle。
可以應用於廣義線性模型(回歸/分類)、概率圖模型(RBM)、和變分推斷(簡便運算)中。
參考:
1.https://www.bilibili.com/video/BV1QW411y7D3?p=2,B站UP主:shuhuai008