自相關函數/自相關曲線ACF
AR(1)模型的ACF:
模型為:

當其滿足平穩的必要條件|a1|<1時(所以說,自相關系數是在平穩條件下求得的):
y(t)和y(t-s)的方差是有限常數,y(t)和y(t-s)的協方差伽馬s

除以伽馬0,可求得ACF如下:



由於{rhoi}其在平穩條件|a1|<1下求得,所以平穩
0<a1<1則自相關系數是直接收斂到0-1<a1<0則自相關系數是震盪收斂到0


對於AR(2)模型的ACF:

兩邊同時乘以y(t),y(t-1),y(t-2)......得到yule-Walker方程,然后結合平穩序列的一些性質(yule-Walker方程法確確實實用了協方差只與時間間隔有關的性質),得到自相關系數如下:
rho0恆為1


令人驚喜的是,這個二階差分方程的特征方程和AR(2)模型的是一致的。
所以,我們的rho本就是在序列平穩的條件下求得,所以{rhoi}序列也平穩。
當然,其收斂形式取決於a1和a2

MA(1)模型的ACF:
模型為:

由於y(t)的表達式是由白噪聲序列中的項組成,所以不需要什么平穩條件,就可以求得rho的形式如下:


對於MA(p)模型,rho(p+1)開始,之后都為0.所以說,到了p階之后突然階段,變為0了。
ARMA(1,1)模型的ACF:
模型為:

還是使用yule-Walker方程法
(用到了序列平穩則協方差只與時間間隔有關的性質)得到:

所以有:


ARMA(p,q)模型的ACF:
ARMA(p,q)的自相關系數滿足:

前p個rho值(rho1,rho2...rhop)可以看做yule-Walker方程的初始條件,其他滯后值取決於特征方程。
(其實是這樣的,rho1,rho2...rhop實際上能寫出一個表達式,而rho(p+1)開始,就滿足一個差分方程,而這個方程對應的特征根(即式1)方程和AR(p)對應的一模一樣),所以,他會從之后q期開始衰減。
所以,還是收斂的,不過收斂形式多樣了。
(由於我們使用了序列平穩這一條件,但是平穩只能推出ai的累積和<1(必要條件),並不能保證每個|ai|都小於1(充分條件,沒說是充要條件),但是,既然我們已經用了{y(t)}平穩這一條件,而{y(t)}和{rho(t)}的特征方程是一樣的,他們的特征根都應該一樣,那么我覺得認為{rho(t)}也是可以的)
偏自相關系數PACF:
為什么需要偏自相關系數?
在AR(1)模型中,即使y(t-2)沒有直接出現在模型中,但是y(t)和y(t-2)之間也相關,
偏相關系數是在排除了其他變量的影響之后兩個變量之間的相關系數。
證明:

然后我證明完了才發現,只要用上面AR(1)中的解就可以很直觀的說明問題了。。

所以我們需要偏自相關系數。
y(t)和y(t-s)的偏自相關系數,排除了插入值y(t-1)到y(t-s+1)間的影響。
所以在AR(1)過程中y(t)和y(t-2)之間的偏自相關系數為0
本書采用了簡單的方式:序列的每一個值減去序列的均值,得到一個新的序列如y(t*)=y(t)-mu,y(t*-1)=y(t-1)-mu

如果我們要求y(t)和y(t-2)之間的偏自相關系數
則構造方程為:
,求出的fi(22)就是y(t)和y(t-2)之間的偏自相關系數。

其實在古扎拉蒂一書中提到了偏回歸系數,偏自回歸系數是先做兩個回歸,然后再對兩個回歸得到的殘差做回歸,最終得到的偏自回歸系數,和直接用多個回歸元對回歸子做回歸得到的系數的結果是一樣的。
我們可以不同構造階數的自回歸模型,得到對應的偏自相關系數。
以下將歸納出偏自相關函數(PACF)的一般表達式(即通過自相關系數求出):


其中:

若樣本量為T,則僅有T/4的滯后量可以同來計算樣本PACF。
AR(p)的PACF函數:

意思就是對於AR(p)過程,當s>p的時候,y(t)和y(t-s)的偏自相關系數為0
所以AR(p)的PACF圖的一個特征就是在p滯后截斷。
MA(1)的PACF:
模型為:

使用滯后算子,結合級數展開,其可以寫為:


(我們應該還是站在平穩的角度考慮問題)
ARMA(p,q)的PACF:

也就是說,ARMA(p,q)模型對應的PACF圖,
其在哪一點開始陡然下降(降到很低開始趨於0)取決於p(跟AR的特點有關)
其趨於0的方式取決於MA部分中的那些系數。
即PACF從滯后p期開始衰減,衰減模式取決於多項式:

一般特征總結如下:


平穩序列的樣本自相關。

geometric 是幾何的意思
符號函數(一般用sign(x)表示)是很有用的一類函數,能夠幫助我們在幾何畫板中實現一些直接實現有困難的構造。 符號函數 能夠把函數的符號析離出來 。在數學和計算機運算中,其功能是取某個數的符號(正或負):
當x>0,sign(x)=1;
當x=0,sign(x)=0;
當x<0, sign(x)=-1

ACF是幾何衰減的(或許也可以稱之為指數吧)
因為根據之前對ARMA(1,1)的相關系數的分析,其結果如下:

oscillating是震盪的意思
(其實我有一個想法,既然有上述表,其實我們完全可以編寫一個函數去繪制圖這些類型的曲線,這樣我們判斷其ARMA模型就會很容易了)
平穩序列的樣本自相關:
由於現實中我們無法獲得總體的均值,方差和協方差,相關系數等,所以使用樣本代替。


Box and Jenkins (1976)討論了在{y(t)}平穩,且誤差為正態分布的假設下,r(s)的分布。
如果r(s)的真實值等於0(即設真實數據生成過程是一個MA(s-1)過程(P59.因為MA(q)過程的ACF在q階之后截斷為0,而ACF就是自相關系數r啊))
則有:

且在大樣本下(T很大的時候,這里T是指樣本個數),r(s)將服從均值為0的正態分布。
這樣看來,在大樣本下r(1)~N(0,1/T),那么我們可以做顯著性檢驗:
注意,我們是在MA(s-1)的假設條件下,設計如下的零假設和備擇假設。
零假設為:1階自回歸在統計上不是顯著的,即p=0
備擇假設: p>0(所以是單側檢驗)
如果計算得到的r(1)>2*square(1/T)
即r(1)大於兩倍標准差,而0-2*sigma差不多就是正態分布右側95%分位點。
於是,在拒絕域,則拒絕零假設。
那么既然p>0,則可以接着對r(2)做顯著性檢驗了。
零假設為:2階自回歸在統計上不是顯著的,即p=1
備擇假設: p>1(所以是單側檢驗)
如r(1)=0.5,且T為100.則利用上述公式可計算得到var(r(2))=0.015
即r(2)的方差為0.015,而標准差為0.123.
如果計算出的r(2)>2*0.123,則可以解決零假設。
我們接受p>!
如此反復地檢驗。(但是通常不超過T/4)
Box and Jenkins 構造出Q統計量用於檢驗一組自相關系數是否顯著異域於0.

在所有的r(k)=0的假設下,Q漸近地~卡方(s)
即較高的自相關系數將導致較高的Q,即如果Q大於臨界值,則拒絕原假設,即至少存在一個自相關系數不為0.
但是Q統計量的問題在於,即便是對於適度da的s,其效果也不佳。
Ljung and Box (1978)提出了更優且在小樣本中仍適用的修正的Q統計量

如果Q大於自由度為s的卡方分布的臨界值,則少存在一個自相關系數不為0.
Q和修正的Q還可以用於檢驗ARMA(p,q)模型中的殘差是否為白噪聲過程。
若使用ARMA(p,q)模型的殘差,如果從模型中得到了s個自相關系數,則Q服從自由度為s-p-q的卡方分布(因為有p+q估計系數啊),如果模型中有截距項,則自由度為s-p-q-1。
在AR(p)的零假設下(即在所有的
都為0(P62.對於純AR(p過程,其PACF在p以后就截斷為0)),
的方差漸進地等於1/T


附件列表