最大似然估計是一種用來在給定觀察數據下估計所需參數的技術。比如,如果已知人口分布遵從正太分布,但是均值和方差未知, MLE(maximum likelihood estimation)可以利用有限的樣本來估計這些參數。
1.正規定義
從分布
f0中引出
n個獨立同分布的觀察
x1,x2,...xn,其中
f0是從一族依賴於幾個
θ參數的分布
f而得來的。
MLE的目標就是最大化似然函數:
L=f(x1,x2,...xn∣θ)=f(x1∣θ)×f(x2∣θ)×...×f(xn∣θ)
通常,
log似然函數更容易處理:
l^=n1logL=n1i=1∑nlogf(xi∣θ)
2.舉例
舉例一
一個硬幣被拋了100次,有61次正面朝上,假設硬幣向上的概率猜測有三個
31,
21,
32,以上三個哪個是最大似然估計?
求解:這個是伯努利分布,假設唯一參數為
p,因此:
P(H=61∣p=31)=(10061)(31)61(1−31)39≈9.6×10−9P(H=61∣p=21)=(10061)(31)61(1−21)390.007P(H=61∣p=32)=(10061)(32)61(1−32)39≈0.40
比較以上三個值可以得出
p=32是極大似然估計。
舉例二
該例子利用導數為0得到極大似然估計,主動計算。
