矩估計與最大似然估計


一、為什么要估計(estimate)

 在概率,統計學中,我們所要觀測的數據往往是很大的,(比如統計全國身高情況)我們幾乎不可能去統計如此之多的值。這時候,就需要用到估計了。我們先抽取樣本,然后通過統計樣本的情況,去估計總體。下面是數學中常用到的術語:

  ·總體(Populantion)。通常它均值(mean)用 μ 表示。方差用 表示。

  ·樣本(Sample)。通常它的均值用 表示,方差用  表示。(另外提一句,求時,通常用n-1為底。這樣是想讓結果跟接近總體的方差,又稱為無偏估計。)

二、矩估計

1、是什么原點矩?

  原點矩這個術語是數學家定義出來的,用於計算方便。所以在"使用"這個level上,我們先不要糾結它怎么來的,為什么叫原點矩。

  來自wiki的定義:原點矩是一類隨機變量的矩.隨機變量X的n階原點矩a_n定義為math

  根據定義,我們可知:

    一階原點矩為

    二階原點矩為

  這兩個是我們比較常用的,應為我們要估計的參數個數一般不多於二(多於2就不好算了。)

2、矩估計的原理

  ①樣本與總體的原點矩是近似的。可以通過讓它們相等來計算。

  ②對於連續型隨機變量:期望  ; 方差 

  ③對於給予的樣本:期望    ;  方差   ,切記這里的X1,X2...Xn都是已知的。

    ④對於各種隨機變量x都有:

3、計算步驟

     S1: 根據題目給出的概率密度函數,計算總體的原點矩(如果只有一個參數只要計算一階原點矩,如果有兩個參數要計算一階和二階)。由於有參數這里得到的都是帶有參數的式子。如果題目給的是某一個常見的分布,就直接列出相應的原點矩(E(x))。

     S2:   根據題目給出的樣本。按照計算樣本的原點矩。(計算方法在上文都有給出)

   S3:   讓總體的原點矩與樣本的原點矩相等,解出參數。所得結果即為參數的矩估計值。

三、最大似然估計

0、基礎概念:概率密度函數。

  概率密度函數是描繪  隨機變量 的函數。我們先講講隨機變量。隨機變量的“變量”這個詞用得有點讓人誤解。跟一般我們理解的變量不同,它代表了某種映射關系(將隨機過程映射到數字),所以我們一般用大寫的X,Y,Z來表示。我們最好把隨機變量當作函數來看。

  簡單的講,概率密度函數表示的就是隨機變量X在某點的概率(所有點的概率和為1)。對於連續型的隨機變量,其圖像通常為一個連續的曲線,離散型的隨機變量的圖像一般是一個一個點組成。

1、似然函數(LH)

  來自wiki的定義:似然函數是一種關於統計模型中的參數的函數,表示模型參數中的似然性。“似然性”與“或然性”或“概率”意思相近,都是指某種事件發生的可能性,但是在統計學中,“似然性”和“或然性”或“概率”又有明確的區分。概率用於在已知一些參數的情況下,預測接下來的觀測所得到的結果,而似然性則是用於在已知某些觀測所得到的結果時,對有關事物的性質的參數進行估計。這里類似於“貝葉斯方法”的思路。   

 在估計中,我們已經取得一些樣本數據(它們是獨立,同分布)。它們發生的概率即為為,由於f(x)中有參數未知,所以我們得到的是一個關於參數的函數。我們把這個函數就當作似然函數。直觀的講,這些樣本數據已經出現了,所以他們同時發生的概率(即似然函數)取最大值的時候最符合對事實的估計。

 通過使似然函數取最大值,就可以估算參數。

2、計算步驟

  S1:   根據對應概率密度函數計算出似然函數L(x)=

  S2:  對似然函數L(x)取對數以方便求解。(由於對數函數是單調增函數,所以對似然函數取log后,與L(x)有相同的最大值點。)

  S3:  根據參數,對第二步所得的函數求導。如果有多個參數,則分別求偏導。

  S4: 令導數等於0(此時L(x)取到最大值).求出參數。此時所得結果即為參數的最大似然估計值。

 

 

 與矩法估計比較,最大似然估計的精確度較高,信息損失較少,但計算量較大。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM