計量經濟學導論07:時間序列模型


時間序列模型

時間序列介紹

在介紹隨機誤差項的序列相關問題的時候,我們簡單引入了時間序列的相關概念,但在本質上,序列相關問題仍然是基於計量經濟學經典假設的條件下所展開的研究內容,並沒有體現出時間序列數據所獨有的一系列特征。從這一節開始,我們進入時間序列模型的討論。

時間序列數據指的是一系列以時間為順序的隨機變量 \(\{\cdots,X_1,X_2,\cdots,X_t,\cdots\}\) ,即 \(\{X_t,\,t\in T\}\) 。這些隨機變量可能是連續的,也可能是離散的。我們所觀測到的只是這些隨機變量在每一個時點的觀測值。

任何時間序列經過合理的函數變換后都可以被認為是由三個部分疊加而成的:趨勢項部分、周期項部分和隨機噪聲項部分。

\[X_t=T_t+S_t+R_t \ , \ \ \ \ t=1,2,\cdots \]

時間序列在適當的去掉趨勢項和季節項后,剩下的隨機部分通常會有某種平穩性。帶有平穩性的時間序列是時間序列分析研究的重點。

模型設定

我們先將截面數據模型“改造”為時間序列模型。在截面數據中,我們認為每一個下角標 \(i\) 都表示一次樣本觀測。事實上,只要我們按照時間的順序觀測得到樣本,並用時間 \(t\) 代替下角標 \(i\) ,就可以建立一個時間序列模型。在這樣的模型設定下,主要包括兩種時間序列模型:

靜態模型:

\[Y_t=\beta_0+\beta_1X_{t1}+...+\beta_kX_{tk}+u_t \ , \]

有限分布滯后模型 (FDL) :

單個解釋變量的情況

\[Y_t=\beta_0+\delta_0X_t+\delta_1X_{t-1}+...+\delta_kX_{t-k}+u_t \ , \]

多個解釋變量的情況(以二元為例)

\[Y_t=\beta_0+\delta_0X_{t,1}+...+\delta_kX_{t-k,1}+\gamma_0X_{t2}+...+\gamma_kX_{t-k,2}+u_t \ . \]

模型假設

由於時間序列數據在小樣本下容易表現出一些和截面數據不同的特征,所以我們需要對截面分析中所做的假定加以修改。

TS.1 線性於參數

隨機過程 \(\{(X_{t1},X_{t2},\cdots,X_{tk},Y_t):t=1,2,\cdots,T\}\) 服從線性模型

\[Y_t=\beta_0+\beta_1X_{t1}+\beta_2X_{t2}+...+\beta_kX_{tk}+u_t \ , \]

其中 \(\{u_t:t=1,2,\cdots,T\}\) 是隨機誤差項,\(T\) 是觀測次數(時期數)。

本質上,假定 TS.1 等同於假定 MLR.1 ,但是在時間序列數據中,我們可以將某個解釋變量或被解釋變量的滯后項作為模型的解釋變量,例如: \(X_{t1}=Z_t,\,X_{t2}=Z_{t-1},\,X_{t3}=Z_{t-2}\) 等。

TS.2 不存在完全共線性

在樣本中(時間序列過程中),沒有任何自變量是恆定不變的,或者是其他自變量的一個完全線性組合。

不存在完全共線性的問題對時間序列數據而言在本質上和截面數據是一樣的。事實上,時間序列的解釋變量之間產生統計意義上的相關性是很常見的,但我們的底線是保證 OLS 能夠正常估計,因此不容許樣本中出現完全相關。

TS.3 零條件均值

對每一個 \(t\) ,給定所有時期的解釋變量,誤差項 \(u_t\) 的期望值為 \(0\)

\[{\rm E}(u_t|\boldsymbol{X})=0 \ , \ \ \ \ t=1,2,\cdots,T \ , \]

\[\boldsymbol{X}=\left(X_{t1},X_{t2},...,X_{tk}\right)\big|_{\,t=1}^{\,T}\ . \]

這里的 \(\boldsymbol{X}\) 是一個 \(T\times k\) 的矩陣。這是一個關鍵的假定,我們先解釋兩個概念:

  • 嚴格外生:\(t\) 時期的誤差項 \(u_t\) 與每個時期的任何解釋變量都無關。

  • 同期外生:\({\rm E}(u_t|X_{t1},...,X_{tk})=0\)

假定 TS.3 不僅僅要求同期外生,解釋變量必須是嚴格外生的。在統計性質上,同期外生條件下,OLS 估計量一致;嚴格外生條件下,OLS 估計量無偏。這一點我們不作證明。

TS.4 同方差性

\(\boldsymbol{X}\) 為條件,在所有時期 \(t\)\(u_t\) 的方差都相等:

\[{\rm Var}(u_t|\boldsymbol{X})={\rm Var}(u_t)=\sigma^2 \ , \ \ \ \ t=1,2,\cdots,T \ , \]

\[\boldsymbol{X}=\left(X_{t1},X_{t2},...,X_{tk}\right)\big|_{\,t=1}^{\,T}\ . \]

這個假定意味着 \({\rm Var}(u_t|\boldsymbol{X})\) 不能依賴於 \(\boldsymbol{X}\) ,而且 \({\rm Var}(u_t)\) 在所有時期都保持不變。當假定 TS.4 不成立時,我們稱誤差是異方差的。

TS.5 無序列相關

\(\boldsymbol{X}\) 為條件,任意兩個不同時期的誤差都不相關:

\[{\rm Corr}(u_t,\,u_s|\boldsymbol{X})=0 \ , \ \ \ \ \forall t\neq s \ . \]

事實上,當這個假定不成立時的情況我們已經在上一節筆記中討論過。但我們需要思考一個這樣一個問題:為什么在截面數據中不假定隨機誤差項是序列無關的呢?答案在於隨機抽樣的假定:當抽樣時隨機的時候,對於任意兩次觀測 \(i\)\(j\)\(u_i\)\(u_j\) 是相互獨立的。但在時間序列的數據中,每一個時間節點的觀測值只有一個,不能做到真正意義上的隨機抽樣,因此也無法保證誤差項之間沒有相關關系,所以在這里做出這個假定。

TS.6 正態性

誤差 \(u_t\) 獨立於 \(\boldsymbol{X}\) ,且具有獨立同分布的

\[u_t\sim N(0,\,\sigma^2) \ . \]

在正態性假定下,我們可以進行統計推斷。

定理總結

在假定 TS.1 至 TS.3 下,以 \(\boldsymbol{X}\) 為條件,OLS 估計量是無偏的

\[{\rm E}(\hat\beta_j)=\beta_j \ , \ \ \ \ j=0,1,2,\cdots,k \ . \]

在時間序列高斯-馬爾科夫假定 TS.1 至 TS.5 下,以 \(\boldsymbol{X}\) 為條件,\(\hat\beta_j\) 的條件方差為

\[{\rm Var}(\hat\beta_j|\boldsymbol{X})=\frac{\sigma^2}{{\rm SST}_j(1-R_j^2)} \ , \]

其中,\({\rm SST}_j\)\(X_{tj}\) 的總平方和,\(R_j^2\)\(X_j\) 對其他所有解釋變量回歸得到的可決系數。

在時間序列高斯-馬爾科夫假定 TS.1 至 TS.5 下,以 \(\boldsymbol{X}\) 為條件,OLS 估計量是最佳線性無偏估計量。另外,誤差方差估計量也是無偏的估計量。

趨勢和季節性

之前我們提到過,時間序列數據可以被認為是由趨勢項部分、周期項部分和隨機噪聲項部分疊加而成。接下來我們討論一下帶有趨勢項和季節項的時間序列如何處理。

描述有趨勢的時間序列

很多經濟時間序列都有隨着時間而上升的共同趨勢,為了能用時間序列數據做出正確的因果推斷,我們必須將包含時間趨勢的部分分離出來,從而避免認為一個變量的趨勢性變化是由另一個變量的變化所致。以簡單回歸模型為例,我們常見的描述有趨勢行為的統計模型如下所示:

線性時間趨勢

\[Y_t=\alpha_0+\alpha_1t+\varepsilon_t \ , \]

其中,\(\varepsilon_t\) 是獨立同分布序列且 \({\rm E}(\varepsilon_t)=0,\,{\rm Var}(\varepsilon_t)=\sigma^2\)

二次時間趨勢

\[Y_t=\alpha_0+\alpha_1t+\alpha_2t^2+\varepsilon_t \ , \]

指數時間趨勢

\[\log(Y_t)=\beta_0+\beta_1t+\varepsilon_t \ . \]

含時間趨勢的回歸

在回歸分析中引入有趨勢的解釋變量並不困難,因為趨勢變量並不一定違背經典假設。很多時候,某些無法觀測的趨勢因素有可能既影響被解釋變量 \(Y_t\) ,又影響解釋變量 \(X_t\) ,此時引入趨勢項就是十分必要的操作,其目的在於消除偽回歸問題。關於偽回歸問題我們下一節再討論,這里我們有兩種常用的含時間趨勢的回歸方式。

直接回歸

第一種方法是直接將趨勢項 \(t\) 作為解釋變量引入回歸模型,以二元模型為例:

\[Y_t=\beta_0+\beta_1X_{t1}+\beta_2X_{t2}+\beta_3t+u_t \ , \]

這里可以理解為解釋變量 \(X_{t3}=t\) 的多元線性回歸。這里的趨勢項 \(t\) 的系數可以解釋被解釋變量 \(Y_t\) 中與 \(X_{t1}\)\(X_{t2}\) 無關的造成增加或下降的因素。

除趨勢 (detrending)

第二種方法是將被解釋變量 \(Y_t\) 和解釋變量 \(X_{t1},\,X_{t2}\) 中與時間趨勢有關的部分去除之后,利用剩余部分進行回歸,步驟如下:

step.1 將 \(Y_t,\,X_{t1},\,X_{t2}\) 分別對常數項和時間趨勢 \(t\) 回歸,並記錄殘差為 \(\dot{Y}_t,\,\dot{X}_{t2},\,\dot{X}_{t2}\)

\[Y_t=\alpha_0+\alpha_1t+\varepsilon_t \ , \]

\[\hat{Y}_t=\hat\alpha_0+\hat\alpha_1t \ , \]

\[\dot{Y}_t=Y_t-\hat{Y}_t \ . \]

step.2 做 \(\dot{Y}_t\)\(\dot{X}_{t1},\,\dot{X}_{t2}\) 的回歸:

\[\dot{Y}_t=\hat\beta_1\dot{X}_{t1}+\hat\beta_2\dot{X}_{t2} \ , \]

估計結果 \(\hat\beta_1\)\(\hat\beta_2\) 與直接回歸得到的結果相同。在這里截距項不是必要的,即使在第二步的回歸中保留了截距項,估計出來的結果也將是 \(0\)

描述有季節性的時間序列

如果一個時間序列是每月或者每季度(甚至每周或每天)觀測得到的,它就有可能表現出季節性變化。一般地,處理回歸模型中季節性的簡單辦法就是引入季節虛擬變量。

假設我們有 \(s\) 個季節的時間序列數據。為避免虛擬變量陷阱,我們在模型中加入一組季節虛擬變量,主要有兩種形式:

無截距項的情況

\[Y_t=\sum_{i=1}^s\gamma_iD_i+\varepsilon_t \ , \]

\(\gamma_i\) 描述了第 \(i\) 個季節的季節性因素。

含截距項的情況

\[Y_t=c+\sum_{i=1}^{s-1}\gamma_iD_i+\varepsilon_t \ , \]

\(\gamma_i\) 描述了第 \(i\) 個季節相對於第 \(s\) 個季節的增加或減少。

含季節性的回歸

直接回歸

類似於含趨勢項的回歸,我們將解釋變量 \(X_t\) 和季節性的虛擬變量一起放入回歸模型中:

\[Y_t=\sum_{i=1}^s\gamma_iD_i+\beta_1X_t+\varepsilon_t \ , \]

\[Y_t=c+\sum_{i=1}^{s-1}\gamma_iD_i+\beta_1X_t+\varepsilon_t \ . \]

一般地,我們選擇帶有截距項的回歸模型。

除季節性 (deseasonalizing)

我們以引入含截距項的季節虛擬變量為例,除季節性回歸的步驟如下:

step.1 將 \(Y_t,\,X_{t}\) 分別對常數項和季節項回歸,並記錄殘差為 \(\dot{Y}_t,\,\dot{X}_{t}\)

\[Y_t=c+\sum_{i=1}^{s-1}\gamma_iD_i+\varepsilon_t \ , \]

\[\hat{Y}_t=\hat{c}+\sum_{i=1}^{s-1}\hat\gamma_iD_i \ , \]

\[\dot{Y}_t=Y_t-\hat{Y}_t \ . \]

step.2 做 \(\dot{Y}_t\)\(\dot{X}_{t}\) 的回歸:

\[\dot{Y}_t=\beta_1\dot{X}_{t}+\varepsilon_t \ , \]

估計結果 \(\hat\beta_1\) 與直接回歸得到的結果相同。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM