矩估計與最大似然估計

本文轉載自查看原文 2013-06-30 17:53 22759 最大似然估計/ 矩估計/ 概率/ 數學/ 統計

一、為什么要估計（estimate）

在概率，統計學中，我們所要觀測的數據往往是很大的，(比如統計全國身高情況）我們幾乎不可能去統計如此之多的值。這時候，就需要用到估計了。我們先抽取樣本，然后通過統計樣本的情況，去估計總體。下面是數學中常用到的術語：

　　·總體（Populantion）。通常它均值（mean）用 μ 表示。方差用表示。

　　·樣本（Sample）。通常它的均值用表示，方差用表示。（另外提一句，求時，通常用n-1為底。這樣是想讓結果跟接近總體的方差，又稱為無偏估計。）

二、矩估計

1、是什么原點矩？

　　原點矩這個術語是數學家定義出來的，用於計算方便。所以在"使用"這個level上，我們先不要糾結它怎么來的，為什么叫原點矩。

　　來自wiki的定義：原點矩是一類隨機變量的矩.隨機變量的n階原點矩 a_n 定義為 math 。

　　根據定義，我們可知：

　　　　一階原點矩為。

　　　　二階原點矩為。

　　這兩個是我們比較常用的，應為我們要估計的參數個數一般不多於二（多於2就不好算了。）

2、矩估計的原理

　　①樣本與總體的原點矩是近似的。可以通過讓它們相等來計算。

　　②對於連續型隨機變量:期望 ; 方差

　　③對於給予的樣本:期望 ; 方差，切記這里的X1,X2...Xn都是已知的。

　 ④對於各種隨機變量x都有：。

3、計算步驟

S1：根據題目給出的概率密度函數，計算總體的原點矩（如果只有一個參數只要計算一階原點矩，如果有兩個參數要計算一階和二階）。由於有參數這里得到的都是帶有參數的式子。如果題目給的是某一個常見的分布，就直接列出相應的原點矩（E(x)）。

S2: 根據題目給出的樣本。按照計算樣本的原點矩。（計算方法在上文都有給出）

　 S3: 讓總體的原點矩與樣本的原點矩相等，解出參數。所得結果即為參數的矩估計值。

三、最大似然估計

0、基礎概念：概率密度函數。

　　概率密度函數是描繪隨機變量的函數。我們先講講隨機變量。隨機變量的“變量”這個詞用得有點讓人誤解。跟一般我們理解的變量不同，它代表了某種映射關系（將隨機過程映射到數字），所以我們一般用大寫的X，Y，Z來表示。我們最好把隨機變量當作函數來看。

　　簡單的講，概率密度函數表示的就是隨機變量X在某點的概率（所有點的概率和為1）。對於連續型的隨機變量，其圖像通常為一個連續的曲線，離散型的隨機變量的圖像一般是一個一個點組成。

1、似然函數（LH）

　　來自wiki的定義：似然函數是一種關於統計模型中的參數的函數，表示模型參數中的似然性。“似然性”與“或然性”或“概率”意思相近，都是指某種事件發生的可能性，但是在統計學中，“似然性”和“或然性”或“概率”又有明確的區分。概率用於在已知一些參數的情況下，預測接下來的觀測所得到的結果，而似然性則是用於在已知某些觀測所得到的結果時，對有關事物的性質的參數進行估計。這里類似於“貝葉斯方法”的思路。　

　在估計中，我們已經取得一些樣本數據（它們是獨立，同分布）。它們發生的概率即為為，由於f(x)中有參數未知，所以我們得到的是一個關於參數的函數。我們把這個函數就當作似然函數。直觀的講，這些樣本數據已經出現了，所以他們同時發生的概率（即似然函數）取最大值的時候最符合對事實的估計。

　通過使似然函數取最大值，就可以估算參數。

2、計算步驟

　　S1: 根據對應概率密度函數計算出似然函數L(x)= 。

　　S2: 對似然函數L(x)取對數以方便求解。（由於對數函數是單調增函數，所以對似然函數取log后，與L(x)有相同的最大值點。）

　　S3: 根據參數，對第二步所得的函數求導。如果有多個參數，則分別求偏導。

　　S4：令導數等於0（此時L(x)取到最大值）.求出參數。此時所得結果即為參數的最大似然估計值。

與矩法估計比較，最大似然估計的精確度較高，信息損失較少，但計算量較大。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 抽樣分布|t分布|中心極限定理|點估計|矩估計|最大似然法| MATLAB 最大似然估計均勻分布的最大似然估計泊松分布的“入"最大似然估計最大似然估計線性回歸實例最小二乘與最大似然估計之間的關系最大似然估計（MLE）和最大后驗概率（MAP）最大似然估計、最大后驗估計、貝葉斯估計的對比最大似然概率估計和朴素貝葉斯分類概率筆記12——多維正態分布的最大似然估計