Univariate Distribution Relationships
APPL: A Probability Programming Language
Maplesoft - Software for Mathematics, Online Learning, Engineering
也有國內大神的解讀:一張圖的故事——概率分布之間的關系(上)
知乎上也有人做了高度的總結:
人們希望能從隨機的現象中,找到規律。於是,概率分布模型就出現了。每設計一個概率分布模型,都要在精確性和普適性之間做折中。我們既希望一個模型能准確表達隨機現象,也希望這個模型能適用於更多的場景。gamma, gaussian 都是經過這樣的折中后,具有數學美的模型。比如,gaussian 模型,是已知二階統計量的最大墒模型。它的概率分布可以完全由二階統計量標准。這個特點讓很多intractable的貝葉斯估計有了close-form的解。再說gamma 模型,首先它的支持域在第一象限,就能表征一些和能量有關的隨機量,比如說一個隨機變量的方差。gamma分布是gaussian的conjugate 分布,能夠和gaussian一起完成很多有close form的推斷任務。從這個角度,gamma分布的設計也是有數學上tractability 的考慮的。只要滿足概率論的三大公理,誰都可以建立概率分布模型。但不是所有人都能想出像gaussian, gamma這樣既有數學上簡潔,又有工程上的普適性的分布。
作者:Leo Cheng
鏈接:https://www.zhihu.com/question/32250763/answer/55340855
來源:知乎
科普一下這段話中的概念:
統計量:樣本觀測值的函數,不依賴未知參數,比如樣本的均值和方差。
二階統計量:幾個重要簡單的機率概念 – 1st and 2nd order statistics p = E(X) —> first order statistics。“方差”這樣的統計量,是指隨機變量的二階函數。
高階統計量:階數大於二階的統計量,主要有高階矩、高階累積量和高階累積量譜。
i.i.d (independent and identically distributed):獨立同分布 iid
最大熵模型:一步一步理解最大熵模型。最大熵原理認為,學習概率模型時,在所有可能的概率模型中,熵最大的模型是最好的模型。
Closed form expression:閉合解。不是有解或者沒解。比如我們常見的一元二次方程就有閉合解、解析解。而However, there are quintic equations without closed-form solutions using elementary functions, such as x5 − x + 1 = 0.
conjugate 分布:共軛分布,已經有篇文章詳解了(copy了),核心就是讓貝葉斯的先驗分布和后驗分布形成鏈條(同分布)。
概率公理:三公理,又稱柯爾莫果洛夫公理。任一事件的概率都可以用到
區間上的一個實數來表示。整體樣本集合中的某個基本事件發生的概率為1。不相交子集的並的事件集合的概率為那些子集的概率的和。