一、為什么要估計(estimate)
在概率,統計學中,我們所要觀測的數據往往是很大的,(比如統計全國身高情況)我們幾乎不可能去統計如此之多的值。這時候,就需要用到估計了。我們先抽取樣本,然后通過統計樣本的情況,去估計總體。下面是數學中常用到的術語:
·總體(Populantion)。通常它均值(mean)用 μ 表示。方差用 表示。
·樣本(Sample)。通常它的均值用 表示,方差用
表示。(另外提一句,求
時,通常用n-1為底。這樣是想讓結果跟接近總體的方差,又稱為無偏估計。)
二、矩估計
1、是什么原點矩?
原點矩這個術語是數學家定義出來的,用於計算方便。所以在"使用"這個level上,我們先不要糾結它怎么來的,為什么叫原點矩。
來自wiki的定義:原點矩是一類隨機變量的矩.隨機變量的n階原點矩
定義為
。
根據定義,我們可知:
一階原點矩為 。
二階原點矩為 。
這兩個是我們比較常用的,應為我們要估計的參數個數一般不多於二(多於2就不好算了。)
2、矩估計的原理
①樣本與總體的原點矩是近似的。可以通過讓它們相等來計算。
②對於連續型隨機變量:期望 ; 方差
③對於給予的樣本:期望
; 方差
,切記這里的X1,X2...Xn都是已知的。
④對於各種隨機變量x都有:。
3、計算步驟
S1: 根據題目給出的概率密度函數,計算總體的原點矩(如果只有一個參數只要計算一階原點矩,如果有兩個參數要計算一階和二階)。由於有參數這里得到的都是帶有參數的式子。如果題目給的是某一個常見的分布,就直接列出相應的原點矩(E(x))。
S2: 根據題目給出的樣本。按照計算樣本的原點矩。(計算方法在上文都有給出)
S3: 讓總體的原點矩與樣本的原點矩相等,解出參數。所得結果即為參數的矩估計值。
三、最大似然估計
0、基礎概念:概率密度函數。
概率密度函數是描繪 隨機變量 的函數。我們先講講隨機變量。隨機變量的“變量”這個詞用得有點讓人誤解。跟一般我們理解的變量不同,它代表了某種映射關系(將隨機過程映射到數字),所以我們一般用大寫的X,Y,Z來表示。我們最好把隨機變量當作函數來看。
簡單的講,概率密度函數表示的就是隨機變量X在某點的概率(所有點的概率和為1)。對於連續型的隨機變量,其圖像通常為一個連續的曲線,離散型的隨機變量的圖像一般是一個一個點組成。
1、似然函數(LH)
來自wiki的定義:似然函數是一種關於統計模型中的參數的函數,表示模型參數中的似然性。“似然性”與“或然性”或“概率”意思相近,都是指某種事件發生的可能性,但是在統計學中,“似然性”和“或然性”或“概率”又有明確的區分。概率用於在已知一些參數的情況下,預測接下來的觀測所得到的結果,而似然性則是用於在已知某些觀測所得到的結果時,對有關事物的性質的參數進行估計。這里類似於“貝葉斯方法”的思路。
在估計中,我們已經取得一些樣本數據(它們是獨立,同分布)。它們發生的概率即為為
,由於f(x)中有參數未知,所以我們得到的是一個關於參數的函數。我們把這個函數就當作似然函數。直觀的講,這些樣本數據
已經出現了,所以他們同時發生的概率(即似然函數)取最大值的時候最符合對事實的估計。
通過使似然函數取最大值,就可以估算參數。
2、計算步驟
S1: 根據對應概率密度函數計算出似然函數L(x)= 。
S2: 對似然函數L(x)取對數以方便求解。(由於對數函數是單調增函數,所以對似然函數取log后,與L(x)有相同的最大值點。)
S3: 根據參數,對第二步所得的函數求導。如果有多個參數,則分別求偏導。
S4: 令導數等於0(此時L(x)取到最大值).求出參數。此時所得結果即為參數的最大似然估計值。
與矩法估計比較,最大似然估計的精確度較高,信息損失較少,但計算量較大。