【重要】時間序列分析——重點內容


本文分為兩個部分:三大模型五個具體分支的計算問題,重點證明。如果有時間,后續會出一個名詞解釋專題。

觀前提示:本文系作者獨立完成,審閱不足,如有發現錯誤,歡迎在評論區指正。

Part 1:具體模型計算

Part 1:AR(1)模型

穩定性條件

滿足\({\rm AR}(1)\)模型的平穩序列被稱為\({\rm AR(1)}\)序列,\({\rm AR}(1)\)模型的基本結構是

\[X_t=aX_{t-1}+\varepsilon_t,\quad |a|<1,\quad \{\varepsilon_t\}\sim {\rm WN}(0,\sigma^2). \]

它有唯一平穩解。如果\(|a|>1\),則此模型不是\({\rm AR}(1)\)模型,參加以下兩圖。

image-20210118211409934 image-20210118211446821

\({\rm AR}(1)\)序列的自協方差函數是其最顯著性質,注意只有穩定性條件滿足時,\(X_t\)才與\(\varepsilon_{t+k}\)無關(\(k>0\))。

\[\gamma_0=\frac{\sigma^2}{1-a^2}>\sigma^2,\\ \gamma_k=a^k\gamma_0\to 0,\quad k\ge 1,\\ a=\frac{\gamma_1}{\gamma_0}. \]

證明:

對於\(\gamma_0\),有

\[\begin{aligned} \gamma_0=&\mathbb{E}(X_t^2)\\ =&\mathbb{E}[(aX_{t-1}+\varepsilon_t)^2]\\ =&a^2\mathbb{E}(X_{t-1}^2)+\mathbb{E}(\varepsilon_t^2)\\ =&a^2\gamma_0+\sigma^2, \end{aligned} \]

\[\gamma_0=\frac{\sigma^2}{1-a^2}>\sigma^2. \]

對於\(k\ge 1\)時的\(\gamma_k\),有

\[\gamma_k=\mathbb{E}(X_tX_{t-k})=\mathbb{E}[(aX_{t-1}+\varepsilon_t)X_{t-k}]=a\gamma_{k-1}. \]

由數學歸納法,有

\[\gamma_k=a^k\gamma_0\to 0. \]

\({\rm AR}(1)\)序列的譜密度:

\[\begin{aligned} f(\lambda)=&\frac{\sigma^2}{2\pi|1-ae^{{\rm i}\lambda}|^2} \\ =&\frac{\sigma^2}{2\pi|1-a\cos\lambda-{\rm i}a\sin\lambda|^2}\\ =&\frac{\sigma^2}{2\pi(1-2a\cos\lambda+a^2)}. \end{aligned} \]

偏相關系數截尾

遞推\({\rm AR}(1)\)序列的偏相關系數:

\[a_{1,1}\ne0,\quad a_{k,k}=0,\quad \forall k>1. \]

\(k=1\)時,由Yule-Walker方程,

\[\gamma_0a_{1,1}=\gamma_1, \]

得到\(a_{1,1}=\gamma_1/\gamma_0=a\ne 0\)

由Yule-Walker方程,

\[\begin{bmatrix} 1 & a & \cdots & a^{n-1} \\ a & 1 & \cdots & a^{n-2} \\ \vdots & \vdots & & \vdots \\ a^{n-1} & a^{n-2} & \cdots & 1 \end{bmatrix}\begin{bmatrix} a_{n,1} \\ a_{n,2} \\ \vdots \\ a_{n,n} \end{bmatrix}=\begin{bmatrix} a \\ a^2 \\ \vdots \\ a^{n} \end{bmatrix}=a\begin{bmatrix} 1 \\ a \\ \vdots \\ a^{n-1} \end{bmatrix}. \]

注意到右端向量與左端系數矩陣第一列相同,由Cramer法則,有\(a_{n,2}=\cdots=a_{n,n}=0\),而\(a_{n,1}=\det(\Gamma_n)/\det(\Gamma_n)=1\),結論得證。

Part 2:AR(2)模型

穩定性條件

滿足\({\rm AR}(2)\)模型的平穩序列稱為\({\rm AR}(2)\)序列,\({\rm AR}(2)\)模型形如

\[X_t=a_1X_{t-1}+a_2X_{t-2}+\varepsilon_t. \]

其中,特征方程\(A(z)=1-a_1z-a_2z^2\)\(|z|\le 1\)內沒有根。

\({\rm AR}(2)\)模型的穩定域\(\mathscr A\)

\[\mathscr A=\{(a_1,a_2)|a_2\pm a_1<1,|a_2|<1 \}. \]

即找到\(f(z)=a_2z^2+a_1z-1\)\(|z|\le 1\)內沒有根的條件,注意到\(f(0)=-1\)

  1. 如果拋物線開口朝上,則\(a_2>0\),由零點存在定理,只需

    \[f(1)=a_2+a_1-1<0,\\ f(-1)=a_2-a_1-1<0. \]

    即:

    \[a_2>0\text{ & }a_2\pm a_1<1. \]

  2. 如果拋物線開口朝下,則\(a_2<0\),對稱軸符號與\(a_1\)的一致,先討論方程組無實根的情況,此時\(\Delta=a_1^2+4a_2<0\),兩個復根是

    \[z=\frac{-a_1\pm{\rm i}\sqrt{-a_1^2-4a_2}}{2a_2}, \]

    要使其模長\(|z|>1\),有

    \[\frac{a_1^2-a_1^2-4a_2}{4a_2^2}=-\frac{1}{a_2}>1. \]

    所以\(a_2>-1\),即:

    \[-1<a_2<0. \]

  3. 最后考慮\(a_2<0\)\(\Delta>0\)的情況,對對稱軸分情況討論。

    1. 如果\(a_1>0\),則對稱軸是正數,所以要滿足\(f(1)<0\),對稱軸\(>1\),即

      \[a_2+a_1<1\text{ & }a_1>-2a_2. \]

    2. 如果\(a_1<0\),則對稱軸是負數,所以要滿足\(f(-1)<0\),對稱軸\(<-1\),即

      \[a_2-a_1<1\text{ & }a_1<2a_2. \]

綜合以上條件,要使得\(A(z)\)的根都在單位圓外,必須有\(a_2\pm a_1<1\)\(|a_2|<1\),圖示如下:

image-20210118225122274

這里,黃色部分對應1中的討論,藍色部分對應2中的討論,紅色和綠色部分對應3中的討論。有幾下幾點需要注意:

  1. 如果\(a_1,a_2\)位於藍色部分,則此時的根是虛根(結合討論可以看出)。
  2. 證明過程的討論是在有實根時,對四個象限分別討論,無實根時單獨討論。
  3. 對於復根部分要額外注意,需要滿足復根也在單位圓外(容易被忽視),否則得到的穩定域會多出\(\mathbb{R}\)上拋物線下方的部分。
  4. 這里沒有對\(a_1=0\)\(a_2=0\)的情況作討論,其討論難度小,所以不作說明。

自相關函數與允許域

\({\rm AR}(2)\)序列的自協方差函數當\(k\ge2\)時也滿足特征多項式差分方程,即

對於\(k=0,1\),有

\[\begin{aligned} \gamma_0=&\mathbb{E}(X_t^2)\\ =&\mathbb{E}[(a_1X_{t-1}+a_2X_{t-2}+\varepsilon_t)^2]\\ =&\mathbb{E}(a_1^2X_{t-1}^2+a_2^2X_{t-2}^2+\varepsilon_t^2+2a_1a_2X_{t-1}X_{t-2})\\ =&(a_1^2+a_2^2)\gamma_0+\sigma^2+2a_1a_2\gamma_1,\\ \gamma_1=&\mathbb{E}(X_tX_{t-1})\\ =&\mathbb{E}[(a_1X_{t-1}+a_2X_{t-2}+\varepsilon_t)X_{t-1}]\\ =&a_1\gamma_0+a_2\gamma_1, \end{aligned} \]

所以

\[\gamma_1=\frac{a_1}{1-a_2}\gamma_0,\\ \gamma_0=\frac{\sigma^2}{1-a_2^2-a_1^2(1-\frac{2a_2}{1-a_2})}. \]

對於\(k\ge 2\),有

\[\begin{aligned} \gamma_k=&\mathbb{E}[X_{t-k}X_t]\\ =&\mathbb{E}[X_{t-k}(a_1X_{t-1}+a_2X_{t-2}+\varepsilon_t)]\\ =&a_1\gamma_{k-1}+a_2\gamma_{k-2}. \end{aligned} \]

注意到\(\gamma_0\)求解不易,所以考慮\({\rm AR}(2)\)序列的自相關函數,有

\[\rho_1=\frac{a_1}{1-a_2},\rho_2=\frac{a_1^2}{1-a_2}+a_2, \\ \rho_k=a_1\rho_{k-1}+a_2\rho_{k-2},\quad \forall k\ge 2. \]

\({\rm AR}(2)\)序列的允許域:\((\rho_1,\rho_2)\)可以由\((a_1,a_2)\)表示,根據\((a_1,a_2)\)的范圍可以推出\((\rho_1,\rho_2)\)的范圍,即允許域,但這不是一個線性變換。

\[\mathscr{C}=\{(\rho_1,\rho_2)|\rho_1^2<(1+\rho_2)/2,|\rho_1|<1,|\rho_2|<1\}. \]

由自協方差函數的有界性,有\(|\rho_1|<1\)\(|\rho_2|<1\)。而

\[\rho_1=\frac{a_1}{1-a_2},\\ \rho_2=\frac{a_1^2}{1-a_2}+a_2, \]

\[a_1=\frac{\rho_1(1-\rho_2)}{1-\rho_1^2},\\ a_2=\frac{\rho_2-\rho_1^2}{1-\rho_1^2}. \]

所以由\(a_2-a_1<1\)

\[\frac{\rho_2-\rho_1^2-\rho_1(1-\rho_2)}{1-\rho_1^2}<1\Rightarrow \rho_2<1, \]

\(a_2+a_1<1\)

\[\frac{\rho_2-\rho_1^2+\rho_1-\rho_1\rho_2}{1-\rho_1^2}<1\Rightarrow \rho_2<1, \]

\(a_2<1\)

\[\rho_2-\rho_1^2<1-\rho_1^2\Rightarrow \rho_2<1, \]

\(a_2>-1\)

\[\rho_2-\rho_1^2>\rho_1^2-1\Rightarrow \rho_1^2<\frac{1+\rho_2}{2}<1. \]

完成此處的證明關鍵在於找到\(a_1,a_2\)\(\rho_1,\rho_2\)相互表達的式子,這可以由Yule-Walker方程得到,即

\[\begin{bmatrix} 1 & \rho_1 \\ \rho_1 & 1 \end{bmatrix}\begin{bmatrix} a_1 \\ a_2 \end{bmatrix}=\begin{bmatrix} \rho_1 \\ \rho_2 \end{bmatrix},\\ \begin{bmatrix} a_1 \\ a_2 \end{bmatrix}=\frac{1}{1-\rho_1^2} \begin{bmatrix} 1 & -\rho_1 \\ -\rho_1 & 1 \end{bmatrix}\begin{bmatrix} \rho_1 \\ \rho_2 \end{bmatrix}=\begin{bmatrix} \frac{\rho_1-\rho_1\rho_2}{1-\rho_1^2} \\ \frac{\rho_2-\rho_1^2}{1-\rho_1^2} \end{bmatrix}. \]

實根不相等時的自相關函數通項

如果\(A(z)=1-a_1z-a_2z^2\)有兩個不等實根,則\(f(\lambda)=\lambda^2-a_1\lambda-a_2\)有兩個不等實根\(\lambda_1,\lambda_2\),且

\[\lambda_1=\frac{1}{z_1},\quad \lambda_2=\frac{1}{z_2}. \\ |\lambda_1|<1,\quad |\lambda_2|<1. \]

由於自相關函數滿足

\[\rho_k=a_1\rho_{k-1}+a_2\rho_{k-2},\quad \forall k\ge2, \]

所以由常系數齊次線性差分方程的求解,有

\[\rho_k=c_1\lambda_1^k+c_2\lambda_2^k, \]

代入\(\rho_0,\rho_1\)的值,有

\[c_1+c_2=\rho_0=1,\\ c_1\lambda_1+c_2\lambda_2=\rho_1, \]

從中可以解得

\[c_1=\frac{\lambda_2-\rho_1}{\lambda_2-\lambda_1},\quad c_2=\frac{\rho_1-\lambda_1}{\lambda_2-\lambda_1}. \]

由韋達定理,代入得

\[\rho_1=\frac{a_1}{1-a_2}=\frac{\lambda_1+\lambda_2}{1+\lambda_1\lambda_2},\\ c_1=\frac{\lambda_1(1-\lambda_2^2)}{(\lambda_1-\lambda_2)(1+\lambda_1\lambda_2)},\quad c_2=\frac{\lambda_2(1-\lambda_1^2)}{(\lambda_2-\lambda_1)(1+\lambda_1\lambda_2)}, \]

所以

\[\rho_k=c_1\lambda_1^k+c_2\lambda_2^k=\frac{(1-\lambda_2^2)\lambda_1^{k+1}-(1-\lambda_1^2)\lambda_2^{k+1}}{(\lambda_1-\lambda_2)(1+\lambda_1\lambda_2)},\quad k\ge0. \]

偏相關系數截尾

正向證明:由Yule Walker方程,只要證明以下三個向量線性相關:

\[\boldsymbol{v}_1=(1,\rho_1,\cdots,\rho_{n-1}),\\ \boldsymbol{v}_2=(\rho_1,1,\rho_1,\cdots,\rho_{n-2}),\\ \boldsymbol{v}_n=(\rho_1,\rho_2,\cdots,\rho_n). \]

也只要證明以下等式成立:

\[\boldsymbol {v}_n=a_1\boldsymbol v_1+a_2\boldsymbol v_2. \]

由自相關函數的遞推式,后\(n-1\)項都是顯然的,而

\[\rho_1=\frac{a_1}{1-a_2}\Rightarrow \rho_1=a_1+a_2\rho_1, \]

所以這就證明了以上三個向量線性相關,即\(\forall n\)\(m>2\),有\(a_{n,m}=0\)。由此表達式,也有

\[a_{n,1}=a_1,\quad a_{n,2}=a_2. \]

遞推預測

顯然\(\hat X_1=0\)\(\hat X_2=L(X_2|X_1)=\rho_1 X_1=\frac{a_1}{1-a_2}X_1\)

對於\(n\ge 3\),由預測方程可以算出

\[\hat X_{n}=a_1X_{n-1}+a_2X_{n-2}, \]

這是因為Yule-Walker方程給出的形式與預測方程一致。

Part 3:MA(1)模型

基本信息

滿足\({\rm MA}(1)\)模型的平穩序列稱為\({\rm MA}(1)\)序列,其基本形式是

\[X_t=\varepsilon_t+b\varepsilon_{t-1},\quad \{\varepsilon_t\}\sim{\rm WN}(0,\sigma^2), \quad |b|\le 1. \]

其自協方差函數是\(1\)后截尾的:

\[\gamma_0=(1+b^2)\sigma^2,\quad \gamma_1=b\sigma^2,\\ \rho_1=\frac{b}{1+b^2}<1. \]

由於\(|b|\le 1\),所以在\([-1,1]\)內,

\[\frac{{\rm d}\rho_1}{{\rm d}b}=\frac{1-b^2}{(1+b^2)^2}>0, \]

\(\rho_1\)\(b\)變化是單調的,所以

\[\rho_1\in\left[-\frac12,\frac12\right]. \]

譜密度:

\[f(\lambda)=\frac{1}{2\pi}\sum_{j=-1}^1\gamma_k e^{-{\rm i}j\lambda}=\frac{\sigma^2}{2\pi}(2b\cos \lambda+1+b^2). \]

注意:以下序列也是\({\rm MA}(1)\)序列,因為其自協方差函數1后截尾,但是模型系數並非現在的系數:

\[X_t=\epsilon_t+3\epsilon_{t-1},\quad \epsilon\sim {\rm WN}(0,\sigma^2) \]

計算其譜密度,有

\[\begin{aligned} f(\lambda)=&\frac{\sigma^2}{2\pi}\left|1+3e^{{\rm i}\lambda} \right|^2\\ =&\frac{\sigma^2}{2\pi}(1+3^2+6\cos \lambda)\\ =&\frac{9\sigma^2}{2\pi}\left(1+\frac{2}{3}\cos \lambda+\frac{1}{9} \right)\\ =&\frac{9\sigma^2}{2\pi}\left|1+\frac{1}{3}e^{{\rm i}\lambda} \right|^2 \end{aligned} \]

所以它滿足的\({\rm MA(1)}\)模型是

\[X_t=\varepsilon_t+\frac{1}{3}\varepsilon_{t-1},\quad \varepsilon_t\sim {\rm WN}(0,3\sigma). \]

這里\(\varepsilon_t\)並非與\(\epsilon_t\)獨立的白噪聲,而是通過以下方式構造的:

\[\varepsilon_t=(1+\frac{1}{3}\mathscr B)^{-1}X_t=\sum_{j=0}^\infty \frac{1}{(-3)^j}X_{t-j}. \]

這樣就有

\[\begin{aligned} \varepsilon_t+\frac13\varepsilon_{t-1}=&\sum_{j=0}^\infty\frac{1}{(-3)^j}X_{t-j}+\frac{1}3\sum_{j=0}^\infty\frac{1}{(-3)^j}X_{t-j-1}\\ =&\sum_{j=0}^\infty\frac{1}{(-3)^j}X_{t-j}+\sum_{j=1}^\infty\frac{1}{-(-3)^j}X_{t-j} \\ =&X_t. \end{aligned} \]

同時

\[f_\varepsilon(\lambda)=\left|\frac{1}{1+\frac13e^{{\rm i}\lambda}}\right|^2f(\lambda)=\frac{9\sigma^2}{2\pi}\left|\frac{1+\frac{1}{3}e^{{\rm i}\lambda}}{1+\frac13e^{{\rm i}\lambda}} \right|^2=\frac{9\sigma^2}{2\pi}, \]

譜密度是常數就說明了\(\varepsilon_t\)是白噪聲。

偏相關系數不截尾

\({\rm MA}(1)\)的偏相關系數滿足:

\[a_{k,k}=-(-b)^k(1-b^2)(1-b^{2k+2})^{-1}. \]

由於\(\rho_1=\frac{b}{1+b^2}\xlongequal{d}\rho\),對\(k>1\)\(\rho_k=0\),由Yule Walker方程,有

\[\begin{bmatrix} 1 & \rho & 0 & \cdots & 0 \\ \rho & 1 & \rho & \cdots & 0 \\ 0 & \rho & 1 & \cdots & 0 \\ \vdots & \vdots & \vdots & & \vdots \\ 0 & 0 & 0 & \cdots &1 \end{bmatrix}\begin{bmatrix} a_{n,1} \\ a_{n,2} \\ a_{n,3} \\ \vdots \\ a_{n,n} \end{bmatrix}=\begin{bmatrix} \rho \\ 0 \\ 0 \\ \vdots \\ 0 \end{bmatrix}. \]

\(n\)階系數矩陣的行列式為\(D_n\),則顯然有

\[D_n=D_{n-1}-\rho^2D_{n-2}, \]

構成一個常系數線性差分方程,特征方程是

\[z^2-z+\rho^2=0, \]

其特征根是

\[z_1=\frac{1+\sqrt{1-4\rho^2}}{2},\quad z_2=\frac{1-\sqrt{1-4\rho^2}}{2}, \]

所以通解為

\[D_n^*=c_1z_1^n+c_2z_2^n, \]

又因為\(D_1=1,D_2=1-\rho^2\),所以

\[D_n=\frac{z_1^{n+1}-z_2^{n+1}}{z_1-z_2}. \]

由Cramer法則,

\[a_{n,n}=\frac{-(-1)^n\rho^n}{D_n}. \]

這就證明了偏相關系數不截尾,因為\(b \ne 0\)\(\rho=0\)

事實上,

\[|D_n|=\frac{1+b^2+\cdots+b^{2n}}{(1+b^2)^n}=\frac{1-b^{2n+2}}{(1+b^2)^n(1-b^2)}, \]

\(D_1,D_2\)顯然,此后

\[\begin{aligned} D_{n-1}-\rho^2D_{n-2}=&\frac{1-b^{2n}}{(1+b^2)^{n-1}(1-b^2)}-\frac{b^2(1-b^{2n-2})}{(1+b^2)^n(1-b^2)}\\ =&\frac{1+b^2-b^{2n}-b^{2n+2}-b^2+b^{2n}}{(1+b^2)^{n}(1-b^2)}\\ =&\frac{1-b^{2n+2}}{(1+b^2)^n(1-b^2)}. \end{aligned} \]

這就得到

\[a_{n,n}=\frac{-(-1)^nb^n(1-b^2)}{1-b^{2n+2}}. \]

遞推預測

對於\({\rm MA}(1)\)序列

\[X_t=\varepsilon_t+b\varepsilon_{t-1},\quad b\le 1. \]

其預測系數是\(q\)截尾的。

\(\boldsymbol X_n=(X_1,\cdots,X_n)'\),樣本信息序列為\(Z_i\)\(\boldsymbol Z_n=(Z_1,\cdots,Z_n)'\),則它們的張成空間相同(這一點可以由歸納法證明),所以

\[L(X_{n+1}|\boldsymbol X_n)=L(X_{n+1}|X_n,\cdots,X_{n-q+1})=\cdots=L(X_{n+1}|Z_n,\cdots,Z_{n-q+1}). \]

這說明只需要使用\(q\)個新息即可,故\(k\ge q\)\(\theta_{n,k}=0\)

並且:

\[\theta_{n,1}=b\sigma^2\nu_{n-1}^{-1}\\ \nu_0=(1+b^2)\sigma^2,\\ \nu_n=\sigma^2(1+b^2-b^2\sigma^2\nu_{n-1}^{-1}). \]

由於\(\hat X_{n+1}=\theta_{n,1}(X_n-\hat X_n)\),兩邊同時乘以\((X_n-\hat X_{n})\)並取期望,有

\[\begin{aligned} &\mathbb{E}[\hat X_{n+1}(X_n-\hat X_{n})] \\ =&\mathbb{E}[X_{n+1}-(X_{n+1}-\hat X_{n+1})](X_n-\hat X_n) \\ =&\gamma_1 \\ =&\theta_{n,1}\mathbb{E}(X_n-\hat X_n)^2 \\ =&\theta_{n,1}\nu_{n-1}. \end{aligned} \]

所以

\[\theta_{n,1}=\frac{\gamma_1}{\mathbb{E}(X_n-\hat X_n)^2}=\frac{b\sigma^2}{\nu_{n-1}}. \]

結合均方誤差遞推公式:

\[\nu_n=\gamma_0-\theta_{n,1}^2\nu_{n-1}=(1+b^2)\sigma^2-\frac{b^2\sigma^4}{\nu_{n-1}}, \]

可以得到\(\theta_{n,1}\)的計算值。

以下給出一些\(\theta_{n,1}\)的計算值:

  1. \(\theta_{1,1}\)

    \[\theta_{1,1}=\gamma^{-1}_0\gamma_1=\frac{b}{1+b^2}; \]

  2. \(\nu_1\)

    \[\nu_1=\gamma_0-\theta_{1,1}^2\nu_0=\frac{1+b^2+b^4}{1+b^2}\sigma^2. \]

  3. \(\theta_{2,1}\)

    \[\theta_{2,1}=\frac{b\sigma^2}{\nu_1}=\frac{b(1+b^2)}{1+b^2+b^4}; \]

  4. \(\nu_2\)

    \[\nu_2=\gamma_0-\theta_{2,1}^2\nu_1=\frac{1+b^2+b^4+b^6}{1+b^2+b^4}\sigma^2. \]

  5. \(\mathcal B_n=1+b^2+\cdots+b^{2n}=\frac{1-b^{2n+2}}{1-b^2}\),則

    \[\theta_{n,1}=\frac{b\mathcal B_{n-1}}{\mathcal B_n},\quad \nu_n=\frac{\sigma^2\mathcal B_{n+1}}{\mathcal B_n}. \]

    可以證明

    \[\begin{aligned} \nu_n=&(1+b^2)\sigma^2-\frac{b^2\mathcal B_{n-1}^2}{\mathcal B_{n}^2}\cdot\frac{\sigma^2\mathcal B_n}{\mathcal B_{n-1}} \\ =&\sigma^2\left[1+b^2\left(1-\frac{\mathcal B_{n-1}}{\mathcal B_n}\right) \right]\\ =&\sigma^2\left[1+b^2\cdot\frac{b^{2n}}{\mathcal B_n} \right]\\ =&\sigma^2\frac{\mathcal B_{n+1}}{\mathcal B_n};\\ \theta_{n,1}=&\frac{b\sigma^2}{\nu_{n-1}}\\ =&\frac{b\mathcal B_{n-1}}{\mathcal B_n}. \end{aligned} \]

Part 4:MA(2)模型

基本信息與穩定性條件

滿足\({\rm MA}(2)\)模型的平穩序列稱為\({\rm MA}(2)\)序列,\({\rm MA}(2)\)模型即滿足

\[X_t=\varepsilon_t+b_1\varepsilon_{t-1}+b_2\varepsilon_{t-2}. \]

這里,特征多項式\(B(z)=1+b_1z+b_2z^2\)\(|z|<1\)內無根,特別當它在單位圓上也無根時稱為可逆的。可逆域為

\[\mathscr I=\{(b_1,b_2):b_2\pm b_1>-1,|b_2|<1\}. \]

注意到\(B(0)=1\),所以當開口向下即\(b_2<0\)時,一定有兩個根,並且對稱軸方向與\(b_1\)一致。

  1. \(b_2<0\)時,只需要\(B(1)>0\)\(B(-1)>0\),即

    \[b_2<0\text{ & }b_2\pm b_1>-1. \]

  2. \(b_2>0\)時,先討論無實根的情況,此時\(\Delta=b_1^2-4b_2<0\),兩個復根是

    \[z_{1,2}=\frac{-b_1\pm{\rm i}\sqrt{4b_2-b_1^2}}{2b_2}, \]

    其模長為

    \[|z|^2=z_1z_2=\frac{1}{b_2}>1, \]

    所以

    \[0<b_2<1\text{ & }\Delta <0. \]

  3. \(b_2>0\)時,對稱軸方向與\(b_1\)不一致。如果有實根,則分兩種情況考慮:

    1. \(b_1<0\),即對稱軸大於0時,必有

      \[-\frac{b_1}{2b_2}>1,\quad B(1)>0, \]

      \[b_1<0\text{ & }b_2>0\text{ & }b_1+2b_2<0\text{ & }b_2+b_1>-1\text{ & }\Delta >0. \]

    2. \(b_1>0\),即對稱軸小於0時,必有

      \[-\frac{b_1}{2b_2}<-1,\quad B(-1)>0, \]

      \[b_1>0\text{ & }b_2>0\text{ & }b_1-2b_2>0\text{ & }b_2-b_1>-1\text{ & }\Delta >0. \]

綜合以上討論就得到了可逆域。

image-20210119173813003

上圖中,綠色為第一部分,藍色為第二部分(即復根),黃色為第三部分。

基本數字特征:

\[\gamma_0=\sigma^2(1+b_1^2+b_2^2),\quad \gamma_1=\sigma^2(b_1+b_1b_2),\quad \gamma_2=\sigma^2b_2;\\ \rho_1=\frac{b_1+b_1b_2}{1+b_1^2+b_2^2},\quad \rho_2=\frac{b_2}{1+b_1^2+b_2^2},\\ \forall k>2,\quad \rho_k=\gamma_k=0. \]

譜密度:

\[f(\lambda)=\frac{\sigma^2}{2\pi}\left|1+b_1e^{{\rm i}\lambda}+b_2e^{2{\rm i}\lambda} \right|^2. \]

Part 5:ARMA(1, 1)模型

基本信息

模型特征:

\[X_t=aX_{t-1}+\varepsilon_t+b\varepsilon_{t-1}. \]

自協方差函數:

\[\gamma_0=\frac{\sigma^2(1+2ab+b^2)}{1-a^2},\quad \rho_1=\frac{(a+b)(ab+1)}{1+2ab+b^2},\\ \forall k\ge 2,\quad \rho_k=a\rho_{k-1}=\cdots=a^{k-1}\rho_1. \]

對於\(k=0\),有

\[\begin{aligned} \mathbb{E}(X_t\varepsilon_t)=&\mathbb E[\varepsilon_t(aX_{t-1}+\varepsilon_t+b\varepsilon_{t-1})]\\ =&\sigma^2,\\ \gamma_0=&\mathbb{E}(X_t^2)=\mathbb{E}[(aX_{t-1}+\varepsilon_t+b\varepsilon_{t-1})^2]\\ =&a^2\gamma_0+(1+b^2+2ab)\sigma^2,\\ \gamma_0=&\frac{\sigma^2(1+2ab+b^2)}{1-a^2}. \end{aligned} \]

對於\(k=1\),有

\[\begin{aligned} \gamma_1=&\mathbb{E}(X_tX_{t-1})=\mathbb{E}[(aX_{t-1}+\varepsilon_t+b\varepsilon_{t-1})X_{t-1}]\\ =&a\gamma_0+b\sigma^2, \\ \\ \rho_1=&\frac{\gamma_1}{\gamma_0}\\ =&a+\frac{b\sigma^2}{\gamma_0}\\ =&\frac{(a+b)(ab+1)}{1+2ab+b^2}. \end{aligned} \]

對於\(k\ge 2\),有

\[\gamma_k=\mathbb{E}(X_tX_{t-k})=\mathbb{E}[(aX_{t-1}+\varepsilon_t+b\varepsilon_{t-1})X_{t-k}]=a\gamma_{k-1},\\ \rho_k=a\rho_{k-1}=\cdots=a^{k-1}\rho_1. \]

譜密度:

\[f(\lambda)=\frac{\sigma^2}{2\pi}\left|\frac{1+be^{{\rm i}\lambda}}{1-ae^{{\rm i}\lambda}} \right|^2. \]

此時的譜密度被稱為有理譜密度。

\({\rm ARMA}(1, 1)\)模型具有Wold表示:

\[X_t=\sum_{j=0}^\infty \psi_j\varepsilon_{t-j}. \]

Wold系數可以遞推計算:定義\(\forall j>q:b_j=0\),則

\[\forall k<0:\psi_k=0,\quad \psi_0=1,\\ \forall k>0:\psi_k=b_k+\sum_{j=0}^pa_j\psi_{k-j}. \]

最佳線性預測

作以下變換:

\[Y_t=\left\{\begin{array}l X_t/\sigma,&t=1; \\ (X_t-aX_{t-1})/\sigma,& t>1. \end{array}\right. \]

\(Y_t\)的樣本新息與\(X_t\)的樣本新息只差一個\(\sigma\)。對\(t\le1\)

\[\mathbb{E}(Y_1^2)=\frac{1}{\sigma^2}\mathbb{E}(X_t^2)=\frac{1+2ab+b^2}{1-a^2}, \]

對於\(t\ge 2\)

\[\mathbb{E}(Y_t^2)=\frac{1}{\sigma^2}\mathbb{E}(\varepsilon_t+b\varepsilon_{t-1})^2=1+b^2, \]

對於\(s=2\)\(t=1\)

\[\mathbb{E}(Y_2Y_1)=\frac{1}{\sigma^2}\mathbb{E}[X_1(\varepsilon_2+b\varepsilon_1)]=b, \]

對於\(s-t=1\)

\[\mathbb{E}(Y_{t+1}Y_t)=\frac1{\sigma^2}\mathbb{E}[(\varepsilon_{t+1}+b\varepsilon_{t})(\varepsilon_t+b\varepsilon_{t-1})]=b, \]

其他情況下

\[\mathbb{E}(Y_sY_t)=0. \]

顯然\(\hat Y_1=0\)\(\hat Y_2=\theta_{1,1}Y_1\),這里

\[\theta_{1,1}=\frac{\mathbb{E}(Y_1Y_2)}{\mathbb{E}(Y_1^2)}=\frac{(1-a^2)b}{1+2ab+b^2}. \]

由於從\(k=2\)開始\(\{Y_k\}\)是一個\({\rm MA}(1)\)序列,所以\(\hat Y_{n+1}=\theta_{n,1}Y_n\),兩邊同時乘以\((Y_n-\hat Y_n)\)並取期望,得到

\[b=\theta_{n,j}\nu_{n-1},(\nu_{n-1}\xlongequal{def}\mathbb{E}(Y_n-\hat Y_n)^2),\\ \theta_{n,j}=\frac{b}{\nu_{n-1}},\\ \nu_n=(1+b^2)-\frac{b^2}{\nu_{n-1}}. \]

最后,從\(Y_t\)反推\(X_t\)的遞推,得到

\[\forall t > 2:\hat X_t=\sigma\hat Y_t+aX_{t-1}=\theta_{t-1,1}(X_{t-1}-\hat X_{t-1})+aX_{t-1}. \]

Part 2:重要定理證明

自協方差函數的正定性

譜密度:如果\(\{X_t\}\)的譜密度\(f(\lambda)\)存在,則對任何\(n\ge 1\)\(\Gamma_n\)正定。

對任何\(n\)維實向量\(\boldsymbol{b}=(b_1,\cdots,b_n)'\),關於\(\lambda\)的函數

\[\sum_{k=1}^n b_ke^{{\rm i}k\lambda} \]

最多只有\(n-1\)個零點(可以看成\(x=e^{{\rm i}\lambda}\)的一個關於\(x\)的多項式)。由於

\[\gamma_0=\int_{-\pi}^{\pi}f(\lambda){\rm d}\lambda>0, \]

所以

\[\begin{aligned} \boldsymbol{b}'\Gamma_{n}\boldsymbol b=&\sum_{j=1}^n\sum_{k=1}^n b_j\gamma_{j-k}b_k \\ =&\sum_{j=1}^n\sum_{k=1}^nb_jb_k\int_{-\pi}^\pi f(\lambda)e^{{\rm i}(k-j)\lambda}{\rm d}\lambda \\ =&\int_{-\pi}^{\pi}f(\lambda)\sum_{j=1}^n\sum_{k=1}^n b_jb_ke^{{\rm i}(k-j)\lambda}{\rm d}\lambda \\ =&\int_{-\pi}^{\pi}\left|\sum_{k=1}^n b_ke^{{\rm i}k\lambda} \right|^2f(\lambda){\rm d}\lambda\\ >&0. \end{aligned} \]

正定性得證。


自協方差函數收斂:如果\(\gamma_k\to 0(k\to \infty)\),則對任何\(n\ge 1\)\(\Gamma_n\)正定。

用反證法,如果\(|\Gamma_{n+1}|=0\)\(|\Gamma_n|\ne 0\),對零均值平穩序列\(\{X_t\}\),定義

\[\boldsymbol{X}_n=(X_1,\cdots,X_n)', \]

對任何實向量\(\boldsymbol{b}=(b_1,\cdots,b_n)'\ne 0\),有

\[\mathbb{E}(\boldsymbol{b}'\boldsymbol {X}_n)^2=\boldsymbol b'\Gamma_n\boldsymbol b>0. \]

同時存在另一組\(\boldsymbol{a}=(a_1,\cdots,a_n,a_{n+1})'\ne 0\),使得

\[\mathbb{E}(\boldsymbol{a}'\boldsymbol{X}_{n+1})^2=\boldsymbol{a}'\Gamma_{n+1}\boldsymbol{a}=0. \]

這說明\(X_{n+1}\)可以被\(\boldsymbol{X}_n\)線性表示,由\(\{X_t\}\)的平穩性,\(\forall k\ge 1\)\(X_{n+k}\)也能被\(\boldsymbol{X}=(X_n,\cdots, X_1)'\)線性表示,即存在一個\(\boldsymbol{\alpha}=(\alpha_1,\cdots,\alpha_n)'\),使得

\[X_{n+k}=\boldsymbol \alpha'\boldsymbol{X}. \]

\(0<\lambda_1\le \lambda_2\le \cdots\le\lambda_n\)\(\Gamma_n\)的特征值,則存在正交矩陣\(T\),使得

\[T\Gamma_nT'={\rm diag}(\lambda_1,\cdots,\lambda_n). \]

此時

\[\begin{aligned} \gamma_0=&\mathbb{E}(X_{n+k}^2)=\mathbb{E}(\boldsymbol{\alpha}'\boldsymbol{X})^2\\ =&\boldsymbol\alpha'\Gamma_n\boldsymbol \alpha\\ =&(T\boldsymbol \alpha)'T\Gamma_nT'(T\boldsymbol\alpha)\\ \ge&\lambda_1\|T\boldsymbol \alpha\|^2\\ =&\lambda_1\|\boldsymbol{\alpha}\|^2.\\ \|\alpha\|\le &\frac{\gamma_0}{\gamma_1}. \end{aligned} \]

另一方面,有

\[\begin{aligned} \gamma_0=&\mathbb{E}(\boldsymbol\alpha'\boldsymbol XX_{n+k})\\ =&\boldsymbol\alpha'\mathbb{E}(\boldsymbol XX_{n+k})\\ =&\boldsymbol\alpha'(\gamma_{k},\gamma_{k+1},\cdots,\gamma_{n+k-1})'\\ \le &\|\boldsymbol\alpha\|\sqrt{\sum_{j=0}^{n-1}\gamma_{k+j}^2}\\ \le& \left(\frac{\gamma_0}{\gamma_1}\sum_{j=0}^{n-1}\gamma_{k+j}^2 \right) \\ \to &0,\quad k\to \infty. \end{aligned} \]

這與\(\gamma_0>0\)矛盾。

推論:線性平穩序列的自協方差矩陣總是正定的。


簡單離散譜序列的自協方差函數是三階退化的。

簡單離散譜序列為\(Z_j(t)=\xi_j\cos(t\lambda_j)+\eta_j\sin(t\lambda_j)\),其自協方差函數為

\[\gamma_{j-s}=\sigma_j^2\cos[(t-s)\lambda_j]. \]

三階自協方差矩陣為

\[\Gamma_3=\sigma_j^2\begin{bmatrix} 1 & \cos \lambda_j & \cos 2\lambda_j \\ \cos\lambda_j & 1 & \cos\lambda_j \\ \cos 2\lambda_j & \cos \lambda_j & 1 \end{bmatrix},\\ \det(\Gamma_3)=(1-\cos^22\lambda_j)-2\cos\lambda_j(\cos\lambda_j-\cos\lambda_j\cos2\lambda_j)=0. \]

AR(p)模型

Wold系數的遞推公式:\(\psi_0=1\),對於\(k\ge 1\),如果定義下標為負數時Wold系數為0,則\(\psi_k=\sum_{j=1}^p a_j\psi_{k-j}\)(即\(A(\mathscr B)\psi_k=0\))。

注意到Wold系數其實是\(A^{-1}(z)\)的泰勒級數,所以

\[\begin{aligned} 1=&A(z)A^{-1}(z)\\ =&-\sum_{j=0}^p a_jz^j\sum_{k=0}^\infty \psi_kz^k\\ =&-\sum_{k=0}^\infty\sum_{j=0}^pa_j\psi_{k-j}z^k. \end{aligned} \]

\(k=0\)時,

\[\sum_{j=0}^pa_j\psi_{-j}=-1\Rightarrow \psi_0=1, \]

\(k\ge 1\)時,

\[\sum_{j=0}^pa_j\psi_{k-j}=0\Rightarrow \psi_k=\sum_{j=1}^p a_j\psi_{k-j}. \]


\({\rm AR}(p)\)序列自協方差函數的結構:\(A(\mathscr B)\gamma_k=\sigma^2\psi_{-k}\)

對於\(k\ge 0\),由Yule-Walker方程直接得到\(A(\mathscr B)\gamma_k=0(k>0)\)\(A(\mathscr B)\gamma_k=\sigma^2\)

對於\(k<0\),有

\[\begin{aligned} &\quad \gamma_k-(a_1\gamma_{k-1}+\cdots+a_p\gamma_{k-p})\\ &=\mathbb{E}\left[X_{t-k}\left(X_t-\sum_{j=1}^p a_jX_{t-j} \right) \right]\\ &=\mathbb{E}(X_{t-k}\varepsilon_t)\\ &= \sigma^2\psi_{-k}. \end{aligned} \]


定理4.1:如果實數\(\gamma_k,k=0,\cdots,n\)使得\(\Gamma_{n+1}\)正定,則由其定義的Yule-Walker系數滿足最小相位條件。

零均值平穩序列\(\{X_t\}\)\({\rm AR}(p)\)序列的充要條件是,它的偏相關系數\(a_{n,n}\)\(p\)后截尾。

充分性:記\(\boldsymbol{a}_p=(a_{p,1},\cdots,a_{p,p})=(a_1,\cdots,a_p)\),由Levinson遞推公式和\(a_{p+k,p+k}=0\)得到,

\[a_{p+1,j}=a_{p,j}-a_{p+1,p+1}a_{p,p+1-j}=a_{p,j},\quad 1\le j\le p,\\ a_{p+k,j}=a_{p+k-1,j}=\cdots=a_{p,j}=a_j,\quad k\le 2,1\le j\le p,\\ a_{p+k,j}=a_{j,j}=0,\quad p<j\le p+k. \]

進而對\(n\ge p\)總有\((a_{n,1},\cdots,a_{n,n})'=(a_1,\cdots,a_p,0,\cdots,0)\)。由Yule-Walker方程,對\(k\ge 1\)

\[\gamma_k=\sum_{j=1}^p a_j\gamma_{k-j}. \]

從這里開始的證明過程很具有代表性,務必掌握。

定義

\[\varepsilon_t=X_{t}-\sum_{j=1}^p a_jX_{t-j},\quad t\in\mathbb{Z}, \]

\(\{\varepsilon_t\}\)是線性濾波,因而是平穩序列,且是零均值的,方差定義為\(\mathbb{D}(\varepsilon_t)=\sigma^2_p>0\)。下證其為白噪聲,對\(t>s\)

\[\begin{aligned} \mathbb{E}(\varepsilon_tX_s)=&\mathbb{E}\left[X_s\left(X_t- \sum_{j=1}^pX_{t-j} \right)\right]\\ =&\gamma_{t-s}-\sum_{j=1}^p\gamma_{t-s-j}\\ =&0,\\ \mathbb{E}(\varepsilon_t\varepsilon_s)=&\mathbb{E}\left[\varepsilon_t\left(X_s-\sum_{j=1}^pX_{s-j} \right) \right]\\ =&\mathbb{E}(\varepsilon_tX_s)-\sum_{j=1}^p\mathbb{E}(\varepsilon_tX_{s-j})\\ =&0. \end{aligned} \]

這就證明了\(\{\varepsilon_t\}\sim {\rm WN}(0,\sigma_p^2)\)。由定理4.1,\(a_1,\cdots,a_j\)滿足最小相位條件,所以

\[X_t=\sum_{j=1}^p a_jX_{t-j}+\varepsilon_t, \]

\(\{X_t\}\)是一個\({\rm AR}(p)\)序列。

必要性:對\({\rm AR}(p)\)序列\(X_t=\sum_{j=1}^p X_{t-j}+\varepsilon_t\),解Yule-Walker方程,得到

\[\begin{bmatrix} \gamma_0 & \gamma_1 & \cdots & \gamma_p & \cdots & \gamma_{n-1} \\ \gamma_1 & \gamma_0 & \cdots & \gamma_{p-1} & \cdots & \gamma_{n-2} \\ \vdots & \vdots & & \vdots & & \vdots \\ \gamma_{n-1} & \gamma_{n-2} & \cdots &\gamma_{n-p-1} & \cdots & \gamma_{0} \end{bmatrix}\begin{bmatrix} a_{n,1} \\ a_{n,2} \\ \vdots \\ a_{n,n} \end{bmatrix}=\begin{bmatrix} \gamma_1 \\ \gamma_2 \\ \vdots \\ \gamma_n \end{bmatrix}. \]

記方程右端向量為\(\boldsymbol{\gamma}_n\),系數矩陣列向量分別為\(\boldsymbol{\beta}_1,\cdots,\boldsymbol{\beta}_n\)。由於\(k\ge 1\)時有

\[A(\mathscr B)\gamma_k=0, \]

所以

\[\boldsymbol{\gamma}_n=\sum_{j=1}^p a_j\boldsymbol{\beta}_j. \]

由Cramer法則,\(a_{n,p+1}=\cdots=a_{n,n}=0\),所以其偏相關系數是\(p\)后截尾的。


逆相關函數:\({\rm AR}(q)\)模型\(X_t=\sum_{j=1}^p a_jX_{t-j}+\varepsilon_t\)的逆相關函數是

\[\gamma_y(k)=\frac{1}{\sigma^2}\sum_{j=0}^{p-k}a_ja_{j+k},\quad 0\le k\le p,a_0=-1. \]

否則\(\gamma_y(k)=0\)

\[f_X(\lambda)=\frac{\sigma^2}{2\pi|A(e^{{\rm i}\lambda})|^2},\quad f_Y(\lambda)=\frac{1}{4\pi^2f_X(\lambda)}=\frac{|A(e^{{\rm i}\lambda})|^2}{2\pi\sigma^2}. \]

這是\({\rm MA}(p)\)序列:\(X_t=A(\mathscr B)\epsilon_t\)\(\{\epsilon_t\}\sim {\rm WN}(0,\sigma^{-2})\)的譜密度,所以其逆相關函數為

\[\gamma_y(k)=\frac{1}{\sigma^2}\sum_{j=0}^{p-k}a_ja_{j+k},\quad 0\le k\le p. \]

MA(q)模型

引理1.2:設實常數\(\{c_j\}\)使得\(c_{q}\ne 0\)

\[g(\lambda)=\frac{1}{2\pi}\sum_{j=-q}^qc_je^{-{\rm i}j\lambda}\ge 0,\quad \lambda\in[-\pi,\pi], \]

則有唯一的實系數多項式

\[B(z)=1+\sum_{j=1}^q b_jz^j\ne 0,\quad |z|<1,b_q\ne0, \]

使得\(g(\lambda)=(\sigma_0^2/2\pi)|B(e^{{\rm i}\lambda})|^2\),這里\(\sigma_0^2\)是某個正常數。

零均值平穩序列\(\{X_t\}\)\({\rm MA}(q)\)序列的充要條件是,其自協方差函數\(q\)后截尾。

必要性是顯然的,下證充分性。當自協方差函數\(q\)后截尾時,由譜密度反演公式,\(\{X_t\}\)的譜密度為

\[f(\lambda)=\frac{1}{2\pi}\sum_{k=-q}^q\gamma_ke^{-{\rm i}k\lambda}. \]

由引理1.2知,存在唯一的\(q\)\(B(z)\),使得

\[f(\lambda)=\frac{\sigma^2}{2\pi}|B(e^{{\rm i}\lambda})|^2. \]

假定\(f(\lambda)\)恆正,對\(|z|\le 1\),有\(B(z)\ne 0\),定義平穩序列

\[\varepsilon_t=B^{-1}(\mathscr B)X_t=\sum_{j=0}^\infty h_jX_{t-j}, \]

由於\(B^{-1}(z)\)\(|z|\le 1\)內解析,所以\(\{h_j\}\)絕對可和,故\(\mathbb{E}(\varepsilon_t)=0\)。為驗證它是一個白噪聲,求其譜密度,為

\[f_\varepsilon(\lambda)=f(\lambda)\frac{1}{|B(e^{{\rm i}\lambda})|^2}=\frac{\sigma^2}{2\pi}, \]

這就證明了\(\{\varepsilon_t\}\sim {\rm WN}(0,\sigma^2)\)。又因為

\[X_t=B(\mathscr B)B^{-1}(\mathscr B)X_t=B(\mathscr B)\varepsilon_t, \]

所以\(\{X_t\}\)是一個\({\rm MA}(q)\)序列。


MA(1)的偏相關系數不截尾,並且可以求出。

上面已經證明過了,在這里再寫一次。設\({\rm MA}(1)\)序列滿足

\[X_t=\varepsilon_t+b\varepsilon_{t-1},\quad |b|<1. \]

假定\(\{\varepsilon_t\}\sim {\rm WN}(0,1)\),則

\[\gamma_0=1+b^2,\quad \gamma_1=b, \]

所以其\(n\)階自協方差矩陣為

\[\Gamma_n=\begin{bmatrix} 1+b^2 & b & 0 & \cdots & 0 \\ b & 1+b^2 & b & \cdots & 0\\ 0 & b & 1+b^2 & \cdots & 0\\ \vdots &\vdots & \vdots & & \vdots \\ 0 & 0 & 0 & \cdots & 1+b^2 \end{bmatrix} \]

定義

\[\mathcal B_n=\frac{1-b^{2(n+1)}}{1-b^2}=1+b^2+b^4+\cdots+b^{2n}. \]

\(\Gamma_n\)的行列式為\(d_n\),有\(d_1=1+b^2\)\(d_2=1+b^2+b^4\)

\[d_n=(1+b^2)d_{n-1}-b^2d_{n-2}. \]

接下來使用數學歸納法能有效減少計算量。

如果\(d_n=\mathcal B_n\)\(k< n\)都成立,則

\[\begin{aligned} d_{n}=&(1+b^2)d_{n-1}-b^2d_{n-2}\\ =&(1+b^2)\mathcal B_{n-1}-b^2\mathcal B_{n-2}\\ =&1+b^2+\cdots+b^{2n-2}+b^2+b^4+\cdots+b^{2n}-(b^2+b^4+\cdots+b^{2n-2})\\ =&1+b^2+b^4+\cdots+b^{2n}\\ =&\mathcal B_n. \end{aligned} \]

所以結論得證,由Cramer法則,

\[a_{n,n}=\frac{-(-1)^nb\cdot b^{n-1}}{\mathcal B_n}=\frac{-(-b)^n(1-b^2)}{1-b^{2n+2}}. \]

ARMA(p, q)模型

Wold系數的遞推公式:\({\rm ARMA}(p,q)\)序列的Wold系數可以被遞推,如果規定\(j>q\)\(b_j=0\)\(k<0\)\(\psi_k=0\),則

\[\psi_j=\left\{\begin{array}l 1,& j=0,\\ b_j+\sum_{k=1}^p a_k\psi_{j-k},&j>0. \end{array}\right. \]

類似\({\rm AR}(p)\)序列,

\[\begin{aligned} A(z)\Phi(z)=&-\sum_{k=0}^p a_kz^k\sum_{j=0}^\infty \psi_jz^j \\ =& -\sum_{j=0}^\infty \sum_{k=0}^p a_k\psi_{j-k}z^j. \end{aligned} \]

\[A(\mathscr B)\Phi(z)\varepsilon_t=A(\mathscr B)X_t=\sum_{j=0}^q b_j\varepsilon_{t-j}, \]

所以

\[A(z)\Phi(z)=-\sum_{j=0}^\infty \sum_{k=0}^pa_k\psi_{j-k}z^j=\sum_{j=0}^pb_jz^j=\sum_{j=0}^\infty b_jz^j. \]

\(j=0\)時,

\[\psi_0=b_0=1, \]

\(j\ge 1\)時,

\[\psi_j=\sum_{k=1}^pa_k\psi_{j-k}+b_j. \]


\({\rm ARMA}(p,q)\)序列的自協方差函數滿足差分方程:

\[\gamma_k-\sum_{j=1}^pa_j\gamma_{k-j}=\left\{\begin{array}l \sigma^2\sum_{j=k}^q b_j\psi_{j-k},& k<q; \\ \sigma^2b_q,& k=q;\\ 0,& k>q. \end{array}\right. \]

\(k<0\)定義\(\psi_k=0\),補充定義\(b_0=1\),由於

\[X_t=\sum_{j=1}^pa_jX_{t-1}+\sum_{j=0}^q b_j\varepsilon_{t-j}, \]

在方程兩邊同時乘以\(X_{t-k}\)后取期望,得到

\[\begin{aligned} \gamma_k=&\mathbb{E}(X_tX_{t-k})\\ =&\mathbb{E}\left[\left(\sum_{j=1}^pa_jX_{t-j}+\sum_{j=0}^qb_j\varepsilon_{t-j} \right)X_{t-k} \right]\\ =&\sum_{j=1}^p a_j\gamma_{j-k}+\mathbb{E}\left(\sum_{j=0}^qb_j\varepsilon_{t-j}\sum_{l=0}^\infty\psi_l\varepsilon_{t-k-l} \right)\\ =&\sum_{j=1}^pa_j\gamma_{j-k}+\sigma^2\sum_{j=0}^q b_j\psi_{j-k},\quad k\in\mathbb{Z}. \end{aligned} \]

這就得到了上述差分方程。


引理2.2:設\(\{X_t\}\)\({\rm ARMA}(p,q)\)模型\(A(\mathscr B)X_t=B(\mathscr B)\varepsilon_t\)的平穩解,如果又有白噪聲\(\{\eta_t\}\)和實系數多項式\(C(\mathscr B)\)\(D(\mathscr B)\)使得

\[C(\mathscr B)X_t=D(\mathscr B)\eta_t,\quad t\in\mathbb{Z}, \]

\(C(z)\)的階數\(\ge p\)\(D(z)\)的階數\(\ge q\)

\({\rm ARMA}(p, q)\)序列延拓的自協方差矩陣,如果階數\(m\ge q\),則是可逆的。

\[\Gamma_{m,q}=\begin{bmatrix} \gamma_q & \gamma_{q-1} & \cdots & \gamma_{q-m+1} \\ \gamma_{q+1} & \gamma_q & \cdots & \gamma_{q-m+2} \\ \vdots & \vdots & & \vdots \\ \gamma_{q+m} & \gamma_{q+m-1} & \cdots & \gamma_q \end{bmatrix}. \]

這個證明較難,主要運用的是\({\rm ARMA}(p,q)\)序列當\(k>q\)\(\gamma_k\)的遞推公式。

用反證法,如果\(|\Gamma_{m,q}|=0\),則存在\(\boldsymbol{\beta}=(\beta_0,\cdots,\beta_{m-1})'\ne 0\),使得\(\Gamma_{m,q}\boldsymbol{\beta}=0\),即

\[\sum_{l=0}^{m-1}\beta_l\gamma_{q+k-l}=0,\quad k=0,1,\cdots,m-1. \]

\({\rm ARMA}(p,q)\)滿足的差分方程,有

\[\sum_{l=0}^{m-1}\beta_l\gamma_{q+m-l}=\sum_{l=0}^{m-1}\beta_l\sum_{k=1}^pa_k\gamma_{q+m-l-k}=\sum_{k=1}^pa_k\sum_{l=0}^{m-1}\beta_l\gamma_{q+k-l-m}=0, \]

依次類推,可以得到

\[\sum_{l=0}^{m-1}\beta_l\gamma_{q+k-l}=0,\quad \forall k\ge 0. \]

\[Y_t=\sum_{l=0}^{m-1}\beta_lX_{t-l}, \]

\(\{Y_t\}\)是零均值平穩序列,又因為

\[\mathbb{E}(Y_tX_{t-q-k})=\sum_{l=0}^{m-1}\beta_l\gamma_{q+k-l}=0,\forall k\ge 0; \\ \mathbb{E}(Y_tY_{t-q-k})=\sum_{l=0}^{m-1}\beta_l\mathbb{E}(Y_{t}X_{t-q-k-l})=0,\forall k\ge 0. \]

這說明\(\{Y_t\}\)的自協方差函數是\(q-1\)后截尾的,是一個\({\rm MA}(q)\)序列,存在\(\alpha_0,\cdots,\alpha_{q-1}\),使得

\[\sum_{l=0}^{m-1}\beta_lX_{t-l}=\sum_{j=0}^{q-1}\alpha_j\varepsilon_{t-j}. \]

這里\(\{\varepsilon_t\}\sim {\rm WN}(0,\sigma^2)\),與引理2.2矛盾。


\({\rm ARMA}(p,q)\)序列的不可再約性:如果零均值平穩序列\(\{X_t\}\)有自協方差函數\(\{\gamma_k\}\),又設存在實數\(a_1,\cdots,a_p\)\(a_p\ne 0\)使得\(A(z)=1-\sum_{j=1}^p a_jz^j\)滿足最小相位條件,且

\[\gamma_k-\sum_{j=1}^pa_j\gamma_{k-j}=\left\{\begin{array}l c\ne 0,& k=q, \\ 0,& k>q. \end{array}\right. \]

\(\{X_t\}\)又是一個\({\rm ARMA}(p',q')\)序列,其中\(p'\le p,q'\le q\)

此定理表明,如果給定了自協方差函數的結構信息,\({\rm ARMA}(p,q)\)的階數信息就是可推斷的。

同時這個定理的啟示是,一旦出現關於自協方差結構的信息,就構造差項序列,它必定是一個白噪聲或滑動平均序列。

\[\mathbb{E}(Y_tX_{t-k})=\mathbb{E}\left[\left(X_t-\sum_{j=1}^p a_jX_{t-j} \right)X_{t-k} \right]=\gamma_k-\sum_{j=1}^p a_j\gamma_{k-j}=\left\{\begin{array}l c,& k=q;\\ 0,& k>q. \end{array}\right. \\ \mathbb{E}(Y_tY_{t-k})=\mathbb{E}\left[Y_t\left(X_{t-k}-\sum_{j=1}^pa_jX_{t-k-j} \right) \right]=\left\{\begin{array}l c,& k=q; \\ 0,& k>q. \end{array}\right. \]

所以\(\{Y_t\}\)是一個\({\rm MA}(q)\)序列,存在實系數多項式\(B(z)\)使得

\[A(\mathscr B)X_t=B(\mathscr B)Y_t, \]

如果\(A(z)\)\(B(z)\)有公共根,則有公因子\(C(z)\),用\(C^{-1}(\mathscr B)\)分別左乘上述模型,即可得到一個更低階的\({\rm ARMA}(p',q')\)模型。


等階\({\rm ARMA}(p,p)\)序列:設\(X_t\)\({\rm AR}(p)\)序列,\(\{\varepsilon_t\}\sim {\rm WN}(0,\sigma^2)\)滿足

\[X_t=\sum_{j=1}^pa_jX_{t-j}+\varepsilon_t,\quad t\in\mathbb{Z}, \]

又設\(\{\eta\}\)是和\(\{\varepsilon_t\}\)獨立的\({\rm WN}(0,a^2)\),則\(Y_t=X_t+\eta_t\)是一個\({\rm ARMA}(p,p)\)序列。

本題意義主要在於,給出一個譜密度的應用場景。

由於\(Y_t=X_t+\eta_t\),所以

\[\begin{aligned} Y_t=&\sum_{j=1}^p a_jX_{t-j}+\varepsilon_t+\eta_t \\ =&\sum_{j=1}^pa_jY_{t-j}+\varepsilon_t+\eta_t-\sum_{j=1}^p a_j\eta_{t-j}. \end{aligned} \]

定義\(Z_t=A(\mathscr B)Y_t\),則

\[Z_t=\varepsilon_t+\eta_t-\sum_{j=1}^pa_j\eta_{t-j},\\ \]

\(k>q\)時,

\[\mathbb{E}(Z_tZ_{t-k})=0,\\ \mathbb{E}(Z_tZ_{t-q})=-a_pa^2\ne 0, \]

所以\(\{Z_t\}\)是一個\({\rm MA}(q)\)序列,\(\{Y_t\}\)是一個\({\rm ARMA}(p',q')\)序列,這里\(p'\le p,q'\le p\)。因為\(Y_t=A^{-1}(\mathscr B)Z_t\),設\(\{Z_t\}\)的譜密度為\(f_Z(\lambda)\),則

\[\begin{aligned} f_Z(\lambda)&=f_\varepsilon(\lambda)+|A(e^{{\rm i}\lambda})|^2f_\eta(\lambda)\\ &=\frac{\sigma^2}{2\pi}+\frac{a^2}{2\pi}|A(e^{{\rm i}\lambda})|^2,\\ f_Y(\lambda)&=\frac{f_Z(\lambda)}{|A(e^{{\rm i}\lambda})|^2}\\ &=\frac{a^2}{2\pi}+\frac{\sigma^2}{2\pi|A(e^{{\rm i}\lambda})|^2}\\ &=\frac{a^2|A(e^{{\rm i}\lambda})|^2+\sigma^2}{2\pi|A(e^{{\rm i}\lambda})|^2}\\ &\xlongequal{def}\frac{a^2}{2\pi}\left|\frac{B(e^{{\rm i}\lambda})}{A(e^{{\rm i}\lambda})} \right|^2. \end{aligned} \]

這表明\(A(z)\)\(B(z)\)無公共根,所以\(\{Y_t\}\)是一個\({\rm ARMA}(p,p)\)序列。

參數估計

如果\(\gamma_k\to 0\),則樣本均值是均值的相合估計量,並且是均方相合估計。

\[\begin{aligned} \mathbb{E}(\bar X-\mu)^2&=\mathbb{E}\left[\frac{1}{N}\sum_{k=1}^N(X_k-\mu) \right]^2\\ &=\frac{1}{N^2}\sum_{j=1}^N\sum_{k=1}^N\gamma_{j-k}\\ &=\frac{1}{N^2}\sum_{k=-N+1}^{N-1}(N-|k|)\gamma_k\\ &\le \frac{1}{N}\sum_{k=-N}^N|\gamma_k|\to 0. \end{aligned} \]


如果定義自協方差函數的估計為

\[\hat\gamma_k=\frac{1}{N}\sum_{j=1}^{N-k}(x_j-\bar x_N)(x_{j+k}-\bar x_N), \]

則自協方差矩陣的估計\(\hat \Gamma_n\)是任意階正定的。

只要\(x_1,x_2,\cdots,x_N\)不全相同,則\(y_i=x_i-\bar x_N\)不全為0,故\(N\times(2N-1)\)型矩陣

\[A=\begin{bmatrix} 0 & \cdots & 0 & y_1 & y_2 & \cdots & y_{N-1} & y_N \\ 0 & \cdots & y_1 & y_2 & y_3 & \cdots & y_N & 0 \\ \vdots & & \vdots & \vdots & \vdots & & \vdots & \vdots \\ y_1 & \cdots & y_{N-1} & y_N & 0 & \cdots & 0 & 0 \end{bmatrix} \]

是滿秩,而

\[\hat \Gamma_N=\frac{1}{N}AA', \]

是正定矩陣,所以其任意階主子式是正定矩陣。


如果\(k\to \infty\)\(\gamma_k\to 0\),則對每個確定的\(k\)\(\hat \gamma_k\)\(\gamma_k\)的漸進無偏估計。

\(\mu=\mathbb{E}(X_1)\),則\(\{Y_t\}=\{X_t-\mu\}\)是零均值平穩序列,且\(\bar Y_N=\bar X_N-\mu\)。由於平移后的樣本自協方差函數不發生變化,所以

\[\begin{aligned} \hat\gamma_k&=\frac{1}{N}\sum_{j=1}^{N-k}(Y_j-\bar Y_N)(Y_{j+k}-\bar Y_N)\\ &=\frac{1}{N}\sum_{j=1}^{N-k}[Y_jY_{j+k}-\bar Y_N(Y_j+Y_{j+k})+\bar Y_N^2]\\ \end{aligned} \]

注意到

\[\mathbb{E}(\bar Y_N^2)\to 0,\\ \mathbb{E}[\bar Y_N(Y_j+Y_{j+k})]\le \sqrt{\mathbb{E}(\bar Y_N^2)\mathbb{E}(Y_{j+k}+Y_j)^2}\le \sqrt{4\mathbb{E}(\bar Y_N^2)\gamma_0}\to 0. \]

所以

\[\mathbb{E}(\hat\gamma_k)=\frac{1}{N}\sum_{j=1}^{N-k}\mathbb{E}(Y_jY_{j+k})+o(1)=\frac{N-k}{N}\gamma_k+o(1)\to \gamma_k. \]


中心極限定理的應用:設\(\{\varepsilon_t\}\)是獨立同分布的\({\rm WN}(0,\sigma^2)\)\(a\in(-1,1)\),如果

\[X_t=aX_{t-1}+\varepsilon_t, \]

\(\mu_n,\sigma_n\),使得

\[\frac{\exp(\bar X_n)-\mu_n}{\sigma_n}\stackrel {d}\to N(0,1). \]

本題的主要意義在於,給出一個中心極限定理的應用場景,盡管不是課本上所提到的那種中心極限定理。

只需求分布函數即可,

\[\begin{aligned} &\quad \mathbb{P}\left(\frac{\exp(\bar X_n)-\mu_n}{\sigma_n}\le x \right)\\ &=\mathbb{P}\left[\bar X_n\le \ln(\sigma_nx+\mu_n) \right]\\ &=\mathbb{P}\left[\frac{X_1+X_2+\cdots+X_n}{n}\le \ln(\mu_n+x\sigma_n) \right]\\ &= \mathbb{P}\left[\frac{a(X_0-X_n)+\varepsilon_1+\cdots+\varepsilon_n}{(1-a)n}\le \ln(\mu_n+x\sigma_n) \right]\\ &=\mathbb{P}\left[\frac{\varepsilon_1+\cdots+\varepsilon_n}{\sqrt{n}}\le\sqrt{n}(1-a)\ln(\mu_n+x\sigma_n)-\frac{a(X_0-X_n)}{\sqrt{n}}\right]\\ &=\mathbb{P}\left[\frac{\sum_{j=1}^n \varepsilon_j}{\sigma\sqrt{n}}\le\frac{\sqrt{n}(1-a)\ln(\mu_n+x\sigma_n)}{\sigma}-\frac{a(X_0-X_n)}{\sigma\sqrt{n}} \right]\\ &\approx\Phi\left(\frac{n(1-a)\ln(\mu_n+x\sigma_n)-a(X_0-X_n)}{\sigma \sqrt{n}} \right). \end{aligned} \]

希望

\[\frac{n(1-a)\ln(\mu_n+x\sigma_n)-a(X_0-X_n)}{\sigma \sqrt{n}}\approx x, \]

\[\frac{\sqrt{n}(1-a)}{\sigma}\ln(\mu_n+x\sigma_n)\approx x, \]

必有\(\mu_n=1\)(以便等價無窮小替換),同時

\[\sigma_n=\frac{\sigma}{\sqrt{n}(1-a)}. \]

線性預測

預測方程:如果\(\boldsymbol{a}\in\mathbb{R}^n\),使得\(\Gamma_x\boldsymbol{a}=\mathbb{E}(\boldsymbol{X}Y)\),則\(L(Y|\boldsymbol{X})=\boldsymbol{a}'\boldsymbol {X}\)

對任何\(\boldsymbol{b}\in\mathbb{R}^n\),有

\[\begin{aligned} \mathbb{E}(Y-\boldsymbol{b}'\boldsymbol{X})^2&=\mathbb{E}[Y-\boldsymbol{a}'\boldsymbol{X}+(\boldsymbol{a}-\boldsymbol{b})'\boldsymbol{X}]^2\\ &=\mathbb{E}(Y-\boldsymbol{a}'\boldsymbol{X})^2+\mathbb{E}[(\boldsymbol a-\boldsymbol b)'\boldsymbol X]^2+2\mathbb{E}[(Y-\boldsymbol a'\boldsymbol X)(\boldsymbol a-\boldsymbol b)'\boldsymbol X]\\ &=\mathbb{E}(Y-\boldsymbol a'\boldsymbol X)^2+\mathbb{E}[(\boldsymbol a-\boldsymbol b)'\boldsymbol X]^2+2(\boldsymbol a-\boldsymbol b)'\mathbb{E}[\boldsymbol X(Y-\boldsymbol a'\boldsymbol X)]\\ &=\mathbb{E}(Y-\boldsymbol a'\boldsymbol X)^2+\mathbb{E}[(\boldsymbol a-\boldsymbol b)'\boldsymbol X]^2\\ &\ge \mathbb{E}(Y-\boldsymbol a'\boldsymbol X)'. \end{aligned} \]

證畢。


預測誤差是逐步遞增的,但有上界;純非決定性平穩序列隨着預測間隔增大將均方收斂於\(0\)

由於

\[\sigma_{k,m}^2=\mathbb{E}[X_{n+k}-L(X_{n+k}|X_n,X_{n-1},\cdots,X_{n-m+1})]^2,\\ \begin{aligned} \sigma_k^2&=\lim_{m\to \infty}\sigma_{k,m}^2\\ &=\lim_{m\to \infty}\mathbb{E}[X_{k}-L(X_{k}|X_0,\cdots,X_{-m+1})]^2\\ &=\lim_{m\to \infty}\mathbb{E}[X_{k-1}-L(X_{k-1}|X_{-1},\cdots,X_{-m})]^2\\ &\ge\lim_{m\to \infty}\mathbb{E}[X_{k-1}-L(X_{k-1}|X_0,\cdots,X_{-m})]^2\\ &=\sigma_{k-1}^2. \end{aligned} \]

這說明預測誤差隨步長單調遞增,但是

\[\sigma_{k}^2=\lim_{m\to \infty}\mathbb{E}[X_k-L(X_k|X_0,\cdots,X_{-m+1})]^2\le \lim_{m\to \infty}\mathbb{E}(X_k)^2=\gamma_0. \]

對於純非決定性平穩序列,隨着預測間隔增大將均方收斂於0,即

\[\quad \lim_{k\to \infty}\lim_{m\to \infty}\mathbb{E}[L(X_{n+k}|X_n,X_{n-1},\cdots,X_{n-m+1})]^2. \]

\(\hat X_{n+k}=L(X_{n+k}|X_n,\cdots,X_{n-m+1})\),則由勾股定理,

\[\mathbb{E}(X_{n+k}^2)=\mathbb{E}(X_{n+k}-\hat X_{n+k})^2+\mathbb{E}(\hat X_{n+k}^2), \]

\(k\to \infty\)時,

\[\lim_{k\to \infty}\mathbb{E}(X_{n+k}^2)=\lim_{k\to \infty}\mathbb{E}(X_{n+k}-\hat X_{n+k})^2=\gamma_0, \]

所以

\[\lim_{k\to \infty}\mathbb{E}(\hat X_{n+k}^2)=0. \]


定理2.4:設\(\boldsymbol{X}_{n,m}=(X_n,X_{n-1},\cdots,x_{n-m+1})'\),對於\(Y\in L^2\),當\(m\to \infty\)時,

\[L(Y|\boldsymbol{X}_{n,m})\stackrel{\text{m.s.}}\to \hat Y=L(Y|H_n). \]

這里\(H_n=\overline{\text{sp}}(X_n,X_{n-1},\cdots)\)

這個定理的意義是理論上的,表示可以有窮歷史預測無窮歷史。

遠期預報的均方誤差:設\(\{X_t\}\)是非決定性平穩序列,則

\[\begin{aligned} L(X_{t+n}|H_t)&=L(U_{t+n}|H_t)+L(V_{t+n}|H_t) \\ &=L\left(\sum_{j=0}^\infty a_j\varepsilon_{t-j}\bigg|H_t \right)+V_{t+n}\\ &=\sum_{j=n}^\infty a_j\varepsilon_{t+n-j}+V_n \end{aligned} \]

所以

\[\mathbb{E}[X_{t+n}-L(X_{t+n}|H_n)]^2=\mathbb{E}\left(\sum_{j=0}^{n-1}a_j\varepsilon_{t+n-j}\right)=\sigma^2\sum_{j=0}^{n-1}a_j^2. \]

\(n\to \infty\)時,預報的均方誤差趨近於\(\mathbb{E}(U_t^2)\)


有窮歷史預測中,誤差的張成空間與原序列的張成空間相同。

\(\{Y_t\}\)是方差有限的零均值時間序列,對任何正整數,令\(\boldsymbol{Y}_n=(Y_1,\cdots,Y_n)'\)\(L_n=\overline{\text{sp}}(\boldsymbol{Y}_n)\)。其最佳線性預測為

\[\hat Y_1=0,\quad \hat Y_n=L(Y_n|\boldsymbol{Y}_{n-1}),\quad n=1,2,\cdots \]

引入預測誤差及其方差為

\[W_n=Y_n-\hat Y_n,\quad \nu_{n-1}=\mathbb{E}(W_n^2), \]

再令\(\boldsymbol{W}_n=(W_1,\cdots, W_n)'\)\(M_n=\overline{\text{sp}}(W_1,\cdots,W_n)\),則欲證明\(\forall n,L_n=W_n\)

對於\(n=1\),由於\(\hat Y_1=0\),所以\(W_1=Y_1\),即\(L_1=W_1\)。假設此結論對\(k\le n-1\)都成立,則當\(k=n\)時,

\[W_n=Y_n-L(Y_n|\boldsymbol{Y}_{n-1})\in L_n,\\ Y_n=W_n+\hat Y_{n}\in M_n. \]

這是因為\(L(Y|\boldsymbol{Y}_{n-1})\in L_{n-1}\)\(\hat Y_n\in L_{n-1}=M_{n-1}\)。這就說明\(L_n=M_n\)


平穩序列的遞推預測:設\(\{X_n\}\)是零均值平穩序列,其自協方差函數為\(\{\gamma_k\}\),設

\[\boldsymbol{X}_n=(X_1,\cdots,X_n)',\quad Z_n=X_n-\hat X_n, \]

則當\(\Gamma_n\)正定時,有

\[\hat X_{n+1}\xlongequal{def}L(X_{n+1}|\boldsymbol{X}_n)=\sum_{j=1}^n\theta_{n,j}Z_{n+1-j}. \]

這里遞推預測系數\(\{\theta_{n,j}\}\)和預測的均方誤差\(\nu_n=\mathbb{E}(Z_{n+1}^2)\)滿足如下的遞推公式:

\[\nu_0=\gamma_0,\\ \theta_{n,n}=\frac{\gamma_n}{\nu_0}=\rho_n,\\ \theta_{n,n-k}=\frac{\gamma_{n-k}-\sum_{j=0}^{k-1}\theta_{k,k-j}\theta_{n,n-j}\nu_j}{\nu_k},\quad 0<k\le n-1,\\ \nu_n=\gamma_0-\sum_{j=0}^{n-1}\theta_{n,n-j}^2\nu_j. \]

最好掌握證明,省得記憶。

由於\(\boldsymbol{X}_n\)的張成空間與\(\boldsymbol{Z}_n\)的張成空間相同,所以預測在形式上是成立的。所以對於\(0\le k\le n-1\)

\[\begin{aligned} \mathbb{E}(\hat X_{n+1}Z_{k+1})&=\mathbb{E}\left[Z_{k+1}\left(\sum_{j=1}^{n}\theta_{n,n+1-j}Z_j \right) \right]\\ &=\sum_{j=1}^n\theta_{n,n+1-j}\mathbb{E}(Z_{k+1}Z_j)\\ &=\theta_{n,n-k}\nu_{k}. \end{aligned} \]

注意到

\[\hat X_{k+1}=\sum_{j=1}^k\theta_{k,j}Z_{k+1-j}=\sum_{j=0}^{k-1}\theta_{k,k-j}Z_{j+1},\\ \mathbb{E}(X_{n+1}Z_{k+1})=\mathbb{E}(\hat X_{n+1}Z_{k+1}), \]

所以

\[\begin{aligned} \theta_{n,n-k}&=\frac{\mathbb{E}(\hat X_{n+1}Z_{k+1})}{\nu_k}\\ &=\frac{\mathbb{E}(X_{n+1}Z_{k+1})}{\nu_k}\\ &=\frac{\mathbb{E}[X_{n+1}(X_{k+1}-\sum_{j=1}^{k}\theta_{k,k+1-j}Z_{j})]}{\nu_k}\\ &=\frac{\gamma_{n-k}-\sum_{j=1}^k\theta_{k,k+1-j}\mathbb{E}(X_{n+1}Z_j)}{\nu_k}\\ &=\frac{\gamma_{n-k}-\sum_{j=1}^k\theta_{k,k+1-j}\mathbb{E}(\hat X_{n+1}Z_j)}{\nu_k}\\ &=\frac{\gamma_{n-k}-\sum_{j=1}^k\theta_{k,k+1-j}\theta_{n,n+1-j}\nu_{j-1}}{\nu_k}\\ &=\frac{\gamma_{n-k}-\sum_{j=0}^{k-1}\theta_{k,k-j}\theta_{n,n-j}\nu_{j}}{\nu_k}. \end{aligned} \]

對於預測的均方誤差,有

\[\nu_n=\mathbb{E}(Z_{n+1}^2)=\mathbb{E}(X_{n+1}^2-\hat X_{n+1}^2)=\gamma_0-\sum_{j=1}^n\theta_{n,n-j}^2\nu_j. \]

可以用它遞推一兩項以作自測。


\({\rm MA}(q)\)序列的遞推預測只需要最后\(q\)個新息。

\({\rm MA}(q)\)序列的逐步預測誤差是\(\{\hat\varepsilon_n\}\)(即樣本新息,\(\hat \varepsilon_n=X_{n}-L(X_n|\boldsymbol{X}_{n-1})\)),則

\[L(X_{n+1}|\boldsymbol{X}_n)=L(X_{n+1}|X_n,\cdots,X_{n-q+1})=L(X_{n+1}|\hat\varepsilon_n,\cdots,\hat\varepsilon_{n-q+1}). \]

也就是

\[L(X_{n+1})=\sum_{j=1}^q\theta_{n,1}\hat\varepsilon_{n+1-j}. \]

從而

\[\nu_n=\gamma_0-\sum_{j=1}^q\theta_{n,1}^2\nu_{n-j}. \]

如果是遠期預測,則

\[L(X_{n+k+1}|\boldsymbol{X}_n)=\sum_{j=k+1}^q\theta_{n+k,j}\hat\varepsilon_{n+k+1-j},\quad 1\le k\le q-1. \]

這是因為當我們知道\({\rm MA}(q)\)模型的系數時,所有遞推系數和預測均方誤差已經可遞推計算,只有\(\hat\varepsilon_{t}\)是依賴於觀測值計算的。


\({\rm ARMA}(p,q)\)序列的遞推預測

對於\({\rm ARMA}(p,q)\)模型序列\(\{X_t\}\),構造輔助數列:

\[Y_t=\left\{\begin{array}l X_t/\sigma,& t=1,2,\cdots,m, \\ A(\mathscr B)X_t/\sigma,& t>m. \end{array}\right.\quad m=\max\{p,q\}. \]

顯然\(Y_t\in\overline{\text{sp}}(X_1,\cdots,X_t)\),且對於\(t>m\)\(X_t=\sigma Y_t+\sum_{j=1}^p a_pX_{t-j}\),由數學歸納法可知\(X_t\)\(Y_t\)的張成空間相同,進而它們的樣本新息張成空間也相同。設\(W_t=Y_t-\hat Y_t\)\(Z_t=X_t-\hat X_t\),總有(省略證明)

\[Z_t=\sigma W_t,\quad \mathbb{E}Z_t^2=\sigma^2\mathbb{E}W_t^2, \]

\(\theta_{n,j}\)\(\{Y_t\}\)的預測遞推系數,則對於\(1\le n\le m\),此時\(\{Y_t\}\)還是平穩的,就有

\[\hat Y_{n+1}=\sum_{j=1}^n\theta_{n,j}W_{n+1-j}, \]

於是

\[\hat X_{n+1}=\sigma\hat Y_{n+1}=\sum_{j=1}^n\theta_{n,j}\sigma W_{n+1-j}=\sum_{j=1}^n\theta_{n,j}Z_{n+1-j},\quad l\le n\le m. \]

對於\(n>m\)

\[\hat Y_{n+1}=\sum_{j=1}^q \theta_{n,j}W_{n+1-j},\\ \hat X_{n+1}=\sigma\hat Y_{n+1}+\sum_{j=1}^p a_jX_{n+1-j}=\sum_{j=1}^pa_jX_{n+1-j}+\sum_{j=1}^q\theta_{n,j}Z_{n+1-j},\quad n>m. \]

注意,這里\(\theta_{n,j}\)\(\{Y_t\}\)的遞推預測系數(而不是\(\{X_t\}\)的),因此要利用非平穩序列的系數遞推預測與預測誤差遞推,稍微麻煩。


遠期預測的無效性:設\(\{X_t\}\)是可逆的\({\rm ARMA}(p,q)\)序列,

\[\hat X_{n+k}\xlongequal{def}L(X_{n+k}|X_n,X_{n-1},\cdots,X_1),\quad k\ge 1. \]

則有

\[\lim_{k\to \infty}\lim_{n\to \infty}\mathbb{E}(\hat X_{n+k}^2)=0,\\ \lim_{n\to \infty}\mathbb{E}(\hat X_{n+1}-X_{n+1})^2=\sigma^2. \]

\(\{X_t\}\)的平穩性,有

\[\hat X_{n+k}\xlongequal{def}L(X_{n+k}|X_n,\cdots,X_1)=L(X_k|X_0,\cdots,X_{-n+1}). \]

所以

\[\lim_{n\to \infty}\hat X_{n+k}=L(X_k|H_0)=L(X_k|M_0). \]

\(X_k\)的Wold展開,有

\[\begin{aligned} &\quad L(X_k|\varepsilon_0,\varepsilon_{-1},\cdots)\\ &=L\left(\sum_{j=0}^{\infty}a_j\varepsilon_{k-j}\bigg|\varepsilon_0,\varepsilon_{-1},\cdots \right)\\ &=\sum_{j=0}^{k-1} a_j\varepsilon_{t-j}. \end{aligned} \]

所以

\[\lim_{k\to \infty}\lim_{n\to \infty}\mathbb{E}(\hat X_{n+k}^2)=\sigma^2\sum_{j=0}^{k-1} a_j^2=0. \]

同時,也有

\[\lim_{n\to \infty}\mathbb{E}[(X_{n+1}-\hat X_{n+1})^2]=\varepsilon_1. \]


對可逆的\({\rm ARMA}(p,q)\)序列,預測的均方誤差收斂於白噪聲方差。

\[\begin{aligned} &\quad \lim_{k\to \infty}\nu_k\\ &=\lim_{k\to \infty}\mathbb{E}(X_{k+1}-\hat X_{k+1})^2\\ &=\lim_{k\to \infty}\mathbb{E}(X_1-L(X_1|X_0,\cdots,X_k))^2\\ &=\mathbb{E}(\varepsilon_1^2) \\ &=\sigma^2. \end{aligned} \]

特別當\(\sigma^2=1\)時,有

\[\lim_{N\to \infty}\frac{1}{N}\ln(\nu_0\nu_1\cdots\nu_{N-1})=0. \]

此即\({\rm ARMA}(p,q)\)的極大似然估計中用到的結論。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM