1 之前說過,運用統計分析常用的觀測方式(觀測尺度、觀測量度)有均值、方差、協方差、自相關、偏相關。但是對於像時間序列這樣一維的數據構成特點。有自有的自協方差、自相關和自偏相關,方式和方法也是引用統計分析的度量方式,根據均值為0,方差為常數等特點,略加改變,形成時間序列這種數據特有的一種“自”度量方式。
2 關於自協方差這塊,我們可以看一下這兩個公式:
3 關於自相關這塊兒,我們也可以看到兩個公式:
4 有偏和無偏有這么一種關系:
5 在k=0,起始值的時候,自相關和自協方差有如下性質:
6 2.3.4.5這里面的解釋如下:
(1) 有偏估計和無偏估計,我們發現在有偏估計和無偏估計的區別知識在求E,也就是求平均值的count個數的時候有區別,這個區別導致有偏和無偏的區別。把上面的公式用大白話來解釋就是,有偏估計的長度n是總體抽樣的長度,不隨着每次計算而改變,統一是一個除數長度;無偏估計的長度是n-k,和Σ求和的右端n-k是一樣的,也就是說,隨着取的k長度不一樣,每次除數是和取樣k長度的個數一致的。一句話叫:統一除一個長度,就有偏了;隨着取樣變化,就無偏的。這就很好理解作為每次計算的自協方差為一個獨立觀察,就觀察這次的自協方差,肯定是無偏,因為長度跟我的一致(n-k)。如果作為一個總體序列來觀察每次自協方差情況,不光觀察這一次的自協方差情況,相對於總體的這個自協方差是什么關系,這樣長度必須要保持不變為n。
(2) 關於這個問題,為了只管理解,舉一個例子:
比如我要對某一個學校一個年級的上千個學生估計他們的平均水平(真實值,上帝才知道的數字),那么我決定抽樣來計算。
我抽出10個人的一個樣本,可以計算出均值。那么如果我下次重新抽樣,抽到10個人可能不一樣了,那么從這個樣本里面計算出來的均值可能就變化了。
因為這個均值是隨着我抽樣變化的,每次這10個人的均值也是隨機變化的,但是隨着我每次都抽10個人樣本抽樣次數越多,這個均值累計起來的大小會符合某一種分布。這種叫做漸進無偏性。說白了漸進無偏性叫放到歷史長河中,你我不過是滄海一粟。就這個道理。
但是,我再改一下,我不每次固定10個人做為一個樣本抽樣。我每次不一定抽幾個人作為一個樣本進行抽樣。這里的n就不一定了。如果我們已知總體(或者你抽樣的總體的個數),這個n就是確定的,但是換句話來說,真實情況都屬於上帝。但是我們不知道真實的總體,但我們可以知道每次抽樣,就這個抽樣來講,他的最優或者最真實的部分就不應該是n了,應該是n-k個樣本,因此,這叫無偏估計,是局部或者說每次的一個最優情況,也是總體最優情況中的一部分而已。
(3) 但是這里要注意一點的是:最優包含無偏,無偏是最優的一部分,有偏是無限趨近於最優;但歸根接地,真正的最優只有上帝知道。關於這個理解我們一定要理解兩個詞,一個叫包含和部分、趨近和漸進。是一件事的兩個不同方面和角度。
(4) 另外,我們這里知道了n-k這個東西。零還有x/n-k 或者1/n-k等等,如果除以這個n-k,這個玩意兒很多時候都能見到,叫做自由度。在整個一個大群體中你沒有自由,所有就是n,但是在微觀的情況下,每個個體也是不一樣的,所以他們自己的由度,就是自由度。n-k就很容易理解了吧。屬於一種無偏估計。
7 另外說一下的是,在Eviews軟件中關於自協方差和偏自相關函數的計算等,都用的是有偏估計,不是用的無偏估計。但是計算AIC等准則和其他東西,用的是無偏估計,因為有一個n-k自由度。因此n-k自由度是一個辨識無偏估計和有偏估計的重要標記。關於這個地方說的應該已經很透徹了,所以關於數學公式,數學字母,重中之重不是解題技巧,解題技巧就那么一種,重要的是對於公式和字母背后的邏輯和想要表達的東西。
8 最近越來越發現,數學語言更像是佛學理論,佛學語言。屬於一種高度哲學。其實也對,看看歷史的發展,數學就是來自於哲學!亞里士多德,畢達哥拉斯等等。沒毛病!