機器學習中的MLE和MAP兩大學派的爭論:
頻率學派 - Frequentist - Maximum Likelihood Estimation (MLE,最大似然估計):
頻率學派認為世界是確定的,有一個本體,這個本體的真值是不變的,我們的目標就是要找到這個真值或真值所在的范圍。
貝葉斯學派 - Bayesian - Maximum A Posteriori (MAP,最大后驗估計):
貝葉斯學派認為世界是不確定的,人們對世界先有一個預判,而后通過觀測數據對這個預判做調整,我們的目標是要找到最優的描述這個世界的概率分布。
在對事物建模時,用θ表示模型的參數,請注意,解決問題的本質就是求θ。那么:
頻率學派:存在唯一真值θ。當數據量趨於無窮時,這種方法能給出精准的估計;然而缺乏數據時則可能產生嚴重的偏差。
貝葉斯學派: θ是一個隨機變量,符合一定的概率分布。在貝葉斯學派里有兩大輸入和一大輸出,輸入是先驗 (prior)和似然 (likelihood),輸出是后驗 (posterior)。
先驗,即P(θ),指的是在沒有觀測到任何數據時對θ的預先判斷,似然,即P(X|θ),是假設θ已知后我們觀察到的數據應該是什么樣子的;后驗,即P(θ|X),是最終的參數分布。

隨着數據量的增加,參數分布會越來越向數據靠攏,先驗的影響力會越來越小
