时间序列模型
时间序列介绍
在介绍随机误差项的序列相关问题的时候,我们简单引入了时间序列的相关概念,但在本质上,序列相关问题仍然是基于计量经济学经典假设的条件下所展开的研究内容,并没有体现出时间序列数据所独有的一系列特征。从这一节开始,我们进入时间序列模型的讨论。
时间序列数据指的是一系列以时间为顺序的随机变量 \(\{\cdots,X_1,X_2,\cdots,X_t,\cdots\}\) ,即 \(\{X_t,\,t\in T\}\) 。这些随机变量可能是连续的,也可能是离散的。我们所观测到的只是这些随机变量在每一个时点的观测值。
任何时间序列经过合理的函数变换后都可以被认为是由三个部分叠加而成的:趋势项部分、周期项部分和随机噪声项部分。
时间序列在适当的去掉趋势项和季节项后,剩下的随机部分通常会有某种平稳性。带有平稳性的时间序列是时间序列分析研究的重点。
模型设定
我们先将截面数据模型“改造”为时间序列模型。在截面数据中,我们认为每一个下角标 \(i\) 都表示一次样本观测。事实上,只要我们按照时间的顺序观测得到样本,并用时间 \(t\) 代替下角标 \(i\) ,就可以建立一个时间序列模型。在这样的模型设定下,主要包括两种时间序列模型:
静态模型:
有限分布滞后模型 (FDL) :
单个解释变量的情况
多个解释变量的情况(以二元为例)
模型假设
由于时间序列数据在小样本下容易表现出一些和截面数据不同的特征,所以我们需要对截面分析中所做的假定加以修改。
TS.1 线性于参数
随机过程 \(\{(X_{t1},X_{t2},\cdots,X_{tk},Y_t):t=1,2,\cdots,T\}\) 服从线性模型
\[Y_t=\beta_0+\beta_1X_{t1}+\beta_2X_{t2}+...+\beta_kX_{tk}+u_t \ , \]其中 \(\{u_t:t=1,2,\cdots,T\}\) 是随机误差项,\(T\) 是观测次数(时期数)。
本质上,假定 TS.1 等同于假定 MLR.1 ,但是在时间序列数据中,我们可以将某个解释变量或被解释变量的滞后项作为模型的解释变量,例如: \(X_{t1}=Z_t,\,X_{t2}=Z_{t-1},\,X_{t3}=Z_{t-2}\) 等。
TS.2 不存在完全共线性
在样本中(时间序列过程中),没有任何自变量是恒定不变的,或者是其他自变量的一个完全线性组合。
不存在完全共线性的问题对时间序列数据而言在本质上和截面数据是一样的。事实上,时间序列的解释变量之间产生统计意义上的相关性是很常见的,但我们的底线是保证 OLS 能够正常估计,因此不容许样本中出现完全相关。
TS.3 零条件均值
对每一个 \(t\) ,给定所有时期的解释变量,误差项 \(u_t\) 的期望值为 \(0\) 。
\[{\rm E}(u_t|\boldsymbol{X})=0 \ , \ \ \ \ t=1,2,\cdots,T \ , \]\[\boldsymbol{X}=\left(X_{t1},X_{t2},...,X_{tk}\right)\big|_{\,t=1}^{\,T}\ . \]
这里的 \(\boldsymbol{X}\) 是一个 \(T\times k\) 的矩阵。这是一个关键的假定,我们先解释两个概念:
-
严格外生:\(t\) 时期的误差项 \(u_t\) 与每个时期的任何解释变量都无关。
-
同期外生:\({\rm E}(u_t|X_{t1},...,X_{tk})=0\)
假定 TS.3 不仅仅要求同期外生,解释变量必须是严格外生的。在统计性质上,同期外生条件下,OLS 估计量一致;严格外生条件下,OLS 估计量无偏。这一点我们不作证明。
TS.4 同方差性
以 \(\boldsymbol{X}\) 为条件,在所有时期 \(t\) ,\(u_t\) 的方差都相等:
\[{\rm Var}(u_t|\boldsymbol{X})={\rm Var}(u_t)=\sigma^2 \ , \ \ \ \ t=1,2,\cdots,T \ , \]\[\boldsymbol{X}=\left(X_{t1},X_{t2},...,X_{tk}\right)\big|_{\,t=1}^{\,T}\ . \]
这个假定意味着 \({\rm Var}(u_t|\boldsymbol{X})\) 不能依赖于 \(\boldsymbol{X}\) ,而且 \({\rm Var}(u_t)\) 在所有时期都保持不变。当假定 TS.4 不成立时,我们称误差是异方差的。
TS.5 无序列相关
以 \(\boldsymbol{X}\) 为条件,任意两个不同时期的误差都不相关:
\[{\rm Corr}(u_t,\,u_s|\boldsymbol{X})=0 \ , \ \ \ \ \forall t\neq s \ . \]
事实上,当这个假定不成立时的情况我们已经在上一节笔记中讨论过。但我们需要思考一个这样一个问题:为什么在截面数据中不假定随机误差项是序列无关的呢?答案在于随机抽样的假定:当抽样时随机的时候,对于任意两次观测 \(i\) 和 \(j\) ,\(u_i\) 和 \(u_j\) 是相互独立的。但在时间序列的数据中,每一个时间节点的观测值只有一个,不能做到真正意义上的随机抽样,因此也无法保证误差项之间没有相关关系,所以在这里做出这个假定。
TS.6 正态性
误差 \(u_t\) 独立于 \(\boldsymbol{X}\) ,且具有独立同分布的
\[u_t\sim N(0,\,\sigma^2) \ . \]
在正态性假定下,我们可以进行统计推断。
定理总结
在假定 TS.1 至 TS.3 下,以 \(\boldsymbol{X}\) 为条件,OLS 估计量是无偏的
在时间序列高斯-马尔科夫假定 TS.1 至 TS.5 下,以 \(\boldsymbol{X}\) 为条件,\(\hat\beta_j\) 的条件方差为
其中,\({\rm SST}_j\) 是 \(X_{tj}\) 的总平方和,\(R_j^2\) 是 \(X_j\) 对其他所有解释变量回归得到的可决系数。
在时间序列高斯-马尔科夫假定 TS.1 至 TS.5 下,以 \(\boldsymbol{X}\) 为条件,OLS 估计量是最佳线性无偏估计量。另外,误差方差估计量也是无偏的估计量。
趋势和季节性
之前我们提到过,时间序列数据可以被认为是由趋势项部分、周期项部分和随机噪声项部分叠加而成。接下来我们讨论一下带有趋势项和季节项的时间序列如何处理。
描述有趋势的时间序列
很多经济时间序列都有随着时间而上升的共同趋势,为了能用时间序列数据做出正确的因果推断,我们必须将包含时间趋势的部分分离出来,从而避免认为一个变量的趋势性变化是由另一个变量的变化所致。以简单回归模型为例,我们常见的描述有趋势行为的统计模型如下所示:
线性时间趋势
其中,\(\varepsilon_t\) 是独立同分布序列且 \({\rm E}(\varepsilon_t)=0,\,{\rm Var}(\varepsilon_t)=\sigma^2\) 。
二次时间趋势
指数时间趋势
含时间趋势的回归
在回归分析中引入有趋势的解释变量并不困难,因为趋势变量并不一定违背经典假设。很多时候,某些无法观测的趋势因素有可能既影响被解释变量 \(Y_t\) ,又影响解释变量 \(X_t\) ,此时引入趋势项就是十分必要的操作,其目的在于消除伪回归问题。关于伪回归问题我们下一节再讨论,这里我们有两种常用的含时间趋势的回归方式。
直接回归
第一种方法是直接将趋势项 \(t\) 作为解释变量引入回归模型,以二元模型为例:
这里可以理解为解释变量 \(X_{t3}=t\) 的多元线性回归。这里的趋势项 \(t\) 的系数可以解释被解释变量 \(Y_t\) 中与 \(X_{t1}\) 和 \(X_{t2}\) 无关的造成增加或下降的因素。
除趋势 (detrending)
第二种方法是将被解释变量 \(Y_t\) 和解释变量 \(X_{t1},\,X_{t2}\) 中与时间趋势有关的部分去除之后,利用剩余部分进行回归,步骤如下:
step.1 将 \(Y_t,\,X_{t1},\,X_{t2}\) 分别对常数项和时间趋势 \(t\) 回归,并记录残差为 \(\dot{Y}_t,\,\dot{X}_{t2},\,\dot{X}_{t2}\) :
step.2 做 \(\dot{Y}_t\) 对 \(\dot{X}_{t1},\,\dot{X}_{t2}\) 的回归:
估计结果 \(\hat\beta_1\) 和 \(\hat\beta_2\) 与直接回归得到的结果相同。在这里截距项不是必要的,即使在第二步的回归中保留了截距项,估计出来的结果也将是 \(0\) 。
描述有季节性的时间序列
如果一个时间序列是每月或者每季度(甚至每周或每天)观测得到的,它就有可能表现出季节性变化。一般地,处理回归模型中季节性的简单办法就是引入季节虚拟变量。
假设我们有 \(s\) 个季节的时间序列数据。为避免虚拟变量陷阱,我们在模型中加入一组季节虚拟变量,主要有两种形式:
无截距项的情况
\(\gamma_i\) 描述了第 \(i\) 个季节的季节性因素。
含截距项的情况
\(\gamma_i\) 描述了第 \(i\) 个季节相对于第 \(s\) 个季节的增加或减少。
含季节性的回归
直接回归
类似于含趋势项的回归,我们将解释变量 \(X_t\) 和季节性的虚拟变量一起放入回归模型中:
一般地,我们选择带有截距项的回归模型。
除季节性 (deseasonalizing)
我们以引入含截距项的季节虚拟变量为例,除季节性回归的步骤如下:
step.1 将 \(Y_t,\,X_{t}\) 分别对常数项和季节项回归,并记录残差为 \(\dot{Y}_t,\,\dot{X}_{t}\) :
step.2 做 \(\dot{Y}_t\) 对 \(\dot{X}_{t}\) 的回归:
估计结果 \(\hat\beta_1\) 与直接回归得到的结果相同。