計量經濟學(經院)復習綱要
緒論
建立經典計量經濟學模型的步驟:理論模型的設計、樣本數據的收集、模型參數的估計、模型的檢驗。
理論模型設計包含的要點:確定模型所包含的變量(被解釋變量、變量時間),確定模型的數學形式,擬定理論模型中待估參數的理論期望值。
樣本數據的分類:時間序列數據、截面數據、面板數據。
樣本數據的質量:完整性、准確性(數據是准確的,數據是模型准確需要的)、可比性、一致性。
模型的檢驗:經濟意義檢驗、統計檢驗、計量經濟學檢驗、模型預測檢驗。
計量經濟學模型成功的三要素:理論、方法和數據。
回歸分析:研究一個變量關於另一個(些)變量的依賴關系的計算方法和理論。其目的在於根據后者的已知或設定值,去估計、預測前者的均值。前一個變量稱為被解釋變量,后一個變量稱為解釋變量。
為什么引入隨機干擾項:代表未知影響因素、代表殘缺數據、代表眾多細小影響因素、代表數據觀測誤差、代表模型設定誤差、變量的內在隨機性。
一元線性回歸計算
區分四個概念:
-
總體回歸線:估計給定\(X\)時的條件期望。
\[f(X)=E(Y|X)=\beta_0+\beta_1X. \] -
總體回歸模型:用於描述每一個個體回歸模型,加入了隨機誤差項。
\[Y_i=\beta_0+\beta_1X_i+\mu_i. \] -
樣本回歸線:由樣本計算出的用於估計總體回歸線的函數。
\[\hat{Y}=\hat\beta_0+\hat\beta_1X. \] -
樣本回歸模型:用於解釋每一個樣本的樣本回歸模型,加入了殘差。
\[Y_i=\hat\beta_0+\hat\beta_1X+e_i. \]
模型估計
經典假設(前四條稱高斯-馬爾科夫假設):
- 回歸模型是正確設定的。
- 解釋變量\(X\)在所抽取的樣本中具有變異性,樣本方差趨於非零常數。
- 對給定\(X\)的任何值,隨機干擾項零均值:\(\mathrm{E}(\mu_i|X)=0\)。
- 對給定\(X\)的任何值,隨機干擾項同方差、序列不相關:\(\mathrm{Var}(\mu_i|X)=\sigma^2\),\(\mathrm{Cov}(\mu_i,\mu_j|X)=0\)。
- 隨機干擾項服從零均值、同方差的正態分布:\(\mu_i|X\sim N(0,\sigma^2)\)。
正規方程組:
估計量的離差形式與樣本回歸函數的離差形式:
矩估計時的總體矩條件與對應的樣本矩條件(矩條件將在工具變量法中發揮作用):
最小二乘估計量具有線性性,無偏性,有效性(最小方差性)與大樣本下的一致性。下面的結果將在預測問題中起到作用。
隨機干擾項的方差估計,這是假設檢驗、預測置信區間的基礎:
檢驗與預測
平方和分解式:在最小二乘估計下,有
- \(\mathrm{TSS}\):總離差平方和(total sum square),即\(\sum y_i^2\),其自由度為\(n-1\),\(n\)是樣本數。
- \(\mathrm{RSS}\):殘差平方和(residual sum square),即\(\sum e_i^2\),其自由度為\(n-k-1\),\(k\)為變量數,一元線性回歸中\(k=1\)。
- \(\mathrm{ESS}\):回歸平方和(explained sum square),即\(\sum \hat y_i^2\),其自由度為\(k\),\(k\)為變量數。
擬合優度:
用擬合優度的觀點來看,擬合優度反映擬合的優良程度,故擬合得越好\(R^2\)越大。為計算,有
\(t\)檢驗:一元線性回歸中的\(t\)檢驗基於變量服從的分布\(\hat\beta_1\sim N(\beta_1,\dfrac{\sigma^2}{\sum x_i^2})\),構造檢驗\(H_0:\beta_1=0\),對未知的\(\sigma^2\),用服從\(\chi^2(n-2)\)分布的\(\hat\sigma^2\)替代,故檢驗統計量為
置信區間:\(\hat\beta_1\pm t_{\frac{\alpha}{2}}(n-2)\cdot S_{\hat\beta_1}\)。
對條件均值的預測:\(\hat Y_0=\hat \beta_0+\hat \beta_1X_0\),
對個別值的預測:\(Y_0=\beta_0+\beta_1X_0+\mu\),從而它是無偏估計,且
多元線性回歸模型
總體回歸模型中包含了\(n\)個方程,從而\(Y,\mu\)是\(n\)維向量,\(\beta\)是\(k+1\)維向量,\(X\)是\((k+1)\times n\)矩陣。
參數估計與預測
基本假設:
-
回歸模型是正確設定的。
-
\(X_1,\cdots,X_k\)在抽取的變量中具有變異性,且不存在完全的多重共線性。
\[\mathrm{rank}(X)=k+1. \] -
隨機干擾項條件零均值。
\[\mathrm{E}(\mu|X)=0. \] -
隨機干擾項條件同方差、序列不相關。
\[\mathrm{Var}(\mu|X)=\sigma^2I_n. \] -
隨機干擾項服從條件正態分布。
\[\mu|X\sim N_n(0,\sigma^2I_n). \]
參數估計量的估計:\(\hat\beta=(X'X)^{-1}X'Y\)。具有線性性、無偏性、有效性以及大樣本下的一致性。
\(\sigma^2\)的估計:\(\hat\sigma^2=\dfrac{e'e}{n-k-1}\),\(k\)為模型中解釋變量的個數。
滿足基本要求的樣本量:\(n\ge 3(k+1)\),或\(n\ge 30\)。
求條件均值\(\mathrm{E}(Y_0)\)的置信區間:\(\hat{Y}_0=X_0\hat\beta\),故
求個別值\(Y_0\)的置信區間:\(Y_0=\hat{Y}_0+\mu\),故
假設檢驗
平方和分解及其自由度:
- \(\mathrm{TSS}\):總平方和,自由度為\(n-1\)。
- \(\mathrm{ESS}\):回歸平方和,自由度為\(k\)。
- \(\mathrm{RSS}\):殘差平方和,自由度為\(n-k-1\)。
擬合優度為\(R^2=1-\dfrac{\mathrm{RSS}}{\mathrm{TSS}}\),為反應變量數的影響,常使用調整可決系數\(\overline{R}^2=1-\dfrac{\mathrm{RSS}/(n-k-1)}{\mathrm{TSS}/(n-1)}\),即分子分母各自除去其自由度,這包含了解釋變量個數的影響。
信息准則:可比較所含解釋變量個數不同模型的擬合優度,不同的信息准則有不同的懲罰項。
- 赤池信息准則:\(\displaystyle{\mathrm{AIC}=\ln\frac{e'e}{n}+\frac{2(k+1)}{n}+1+\ln(2\pi)}\)。
- 施瓦茨准則:\(\displaystyle{\mathrm{SC}=\ln\frac{e'e}{n}+\frac{k+1}{n}\ln n+1+\ln(2\pi)}\)。
\(t\)檢驗中,\(S_{\hat\beta_j}^2\)是\(\hat\beta_j\)的方差估計,實際上是\(\mathrm{Var}(\hat\beta)\)中第\(j\)個對角元素,再利用\(\hat\sigma^2\)替代即可。
受約束回歸:對全估計參數最小二乘的殘差平方和為\(\mathrm{RSS}_{U}\),如果對參數施加約束得到的殘差平方和為\(\mathrm{RSS}_{R}\),則自然有\(\mathrm{RSS}_{U}\le \mathrm{RSS}_{U}\)。受約束回歸檢驗的假設是\(H_0\):約束為真。如果\(H_0\)成立,施加的約束為真,則兩個殘差平方和之間不應具有過大的差異,構造\(F\)統計量為
因此,如果\(F>F_{\alpha}(k_{U}-k_{R},n-k_{U}-1)\),則拒絕原假設,認為約束為假。注意\(F\)檢驗總是單邊的。
-
\(F\)檢驗:原假設是\(\beta_1=\beta_2=\cdots=\beta_k\),從而\(\mathrm{RSS}_{R}=\sum y_i^2=\mathrm{TSS}\),故
\[F=\frac{(\mathrm{TSS-RSS})/k}{\mathrm{TSS}/(n-k-1)}=\frac{\mathrm{ESS}/k}{\mathrm{TSS}/(n-k-1)}. \] -
去掉\(q\)個變量:原假設是\(\beta_1=\cdots=\beta_q=0\),從而
\[F=\frac{(\mathrm{RSS}_{R}-\mathrm{RSS}_{U})/q}{\mathrm{RSS}_{U}/(n-k-1)}=\frac{(\mathrm{RSS}_{R}-\mathrm{RSS})/q}{\mathrm{RSS}/(n-k-1)}. \] -
增加\(q\)個變量:原假設是\(\beta_{k+1}=\cdots=\beta_{k+q}\),從而
\[F=\frac{(\mathrm{RSS}_{R}-\mathrm{RSS}_{U})/q}{\mathrm{RSS}_{U}/(n-(k+q)-1)}=\frac{(\mathrm{RSS}-\mathrm{RSS}_{U})/q}{\mathrm{RSS}_{U}/(n-k-q-1)}. \] -
鄒氏穩定性檢驗:有兩組樣本\(X^{(1)},X^{(2)}\),估計出兩組參數\(\alpha,\beta\),原假設是\(\alpha=\beta\),從而
\[F=\frac{(\mathrm{RSS}_{R}-\mathrm{RSS}_{U})/(k+1)}{\mathrm{RSS}_{U}/(n_1+n_2-(2k+2))}. \]
其他問題
雙對數線性模型中,\(\ln Y=\beta_0+\beta_1\ln X\),\(\beta_1\)的含義是彈性,即\(X\)變動\(1\%\)帶動\(Y\)變動\(\beta_1\%\)。
半對數線性模型分為兩種:
- \(\ln Y=\beta_0+\beta_1X\),\(\beta_1\)含義是\(X\)絕對變化\(1\)單位帶動\(Y\)相對變化\(\beta_1\%\)。
- \(Y=\beta_0+\beta_1\ln X\),\(\beta_1\)含義是\(X\)相對變化\(1\%\)帶動\(Y\)絕對變化\(\beta_1\)。
虛擬變量用只取\(0,1\)的\(D\)來表示,它依然使得滿足經典假設。虛擬變量陷阱指的是,引入虛擬變量使得原模型存在嚴格的多重共線性,從而無法求參數估計量。
對虛擬變量的引入,可以使用加法方式,或者乘法方式。
- 加法方式引入,即\(Y=\beta_0+\beta_1X+\beta_2D+\mu\),這樣\(D\)將只影響原模型的截距。
- 乘法方式引入,即\(Y=\beta_0+\beta_1X_1+\beta_2DX_2+\mu\),這樣\(D\)既影響斜率又影響截距。
放寬基本假定
違背基本假定的情形主要包括:
- 解釋變量之間存在嚴重的多重共線性。
- 隨機干擾項序列存在異方差性。
- 解釋變量具有內生性。
- 模型有設定偏誤。
多重共線性
定義:如果某兩個或多個解釋變量之間出現了相關性,則稱為存在多重共線性。
產生原因:
- 經濟變量相關的共同趨勢。
- 模型設定不謹慎。
- 樣本資料的限制。
后果:
- 完全共線性下參數估計量不存在。
- 近似共線性下參數估計量方差變大。
檢驗:
-
綜合統計檢驗法:如果\(F\)值和\(R^2\)值較大,但各參數估計量的\(t\)檢驗值較小,則可能存在多重共線性。
-
判定系數:對某個\(X_j\),用模型中的其他變量對其作回歸,得到回歸方程的擬合優度\(R_j^2\)稱為該變量的判定系數,顯然判定系數越大,\(X_j\)越能被其他變量所解釋,故更容易存在多重共線性。對判定系數作\(F\)檢驗,有
\[F_j=\frac{R_j^2/(k-1)}{(1-R_j^2)/(n-k)}\sim F(k-1,n-k). \] -
逐步回歸。
解決方案:逐步回歸法,應注意排除變量后,保留在模型中變量的系數的經濟意義會發生變化。
異方差性
定義:隨機干擾項的方差不再是常數,而是互不相同(一般是解釋變量的函數),即
產生原因:對截面數據作樣本的計量經濟學問題,由於在不同樣本點上解釋變量以外的其他因素差異較大,所以往往存在異方差性。可分類為單增型、單減型、復雜型。
后果:參數估計量非有效,顯著性檢驗失去意義,預測功能失效。
檢驗:
-
圖示檢驗法:繪制\(e_i^2-X\)散點圖輔助判斷。
-
布羅施-帕甘檢驗(BP檢驗):用變量的一次項回歸殘差平方和,即構造輔助回歸
\[e_i^2=\delta_0+\delta_1 X_{i1}+\cdots+\delta_kX_{ik}+\varepsilon_i. \]原假設是\(e_i^2\)與樣本之間不存在函數關系,即\(\delta_1=\cdots=\delta_k=0\),由受約束回歸原理,檢驗統計量為
\[F=\frac{R^2_{e^2}/k}{(1-R_{e^2}^2/(n-k-1))}\sim F(k,n-k-1). \]若使用拉格朗日乘數檢驗,則\(LM=nR_{e^2}^{2}\),在\(n\to \infty\)時\(LM\sim \chi^2(k)\)。
-
懷特檢驗:用變量的二次及以下項回歸殘差平方和,一般對雙變量\(X_1,X_2\)模型,其回歸對象是
\[e_i^2=\delta_{0}+\delta_1X_{1i}+\delta_2X_{2i}+\delta_3X_{1i}X_{2i}+\delta_4X_1^{2i}+\delta_5X_2^{2i}+\varepsilon_i,\\ F=\frac{R_{e^2}^2/5}{(1-R_{e^2}^2)/(n-6)}\sim F(5,n-6);\\ LM=nR_{e^2}^{2}\sim \chi^3(5). \]
解決方法:
-
加權最小二乘法(WLS):先設法找到\(\mu_i\)和函數之間的關系\(f(X_i)\),然后用\(\dfrac{1}{\sqrt{f(X_i)}}\)對每個方程加權,使得新的模型是同方差的。主要難點在於估計函數形式\(f\)。
一種估計方式是假定\(\mathrm{Var}(\mu_i|X_i)=\sigma^2\exp(\alpha_0+\alpha_1X_{i1}+\cdots+\alpha_kX_{ik})\),對參數的估計采用
\[\ln (e_i^2)=\delta_0+\alpha_1X_{i1}+\alpha_2X_{i2}+\cdots+\alpha_kX_{ik}+\nu_i. \]估計參數后,就得到
\[\hat\mu_i^2=\exp(\hat\delta_0+\alpha_1X_{i1}+\cdots+\alpha_kX_{ik}),\\ \hat w_i=\frac{1}{\sqrt{\exp(\hat\delta_0+\hat\alpha_1X_{i1}+\cdots+\alpha_kX_{ik})}}. \] -
異方差穩健標准誤:不改變參數估計量\(\tilde\beta_1=\hat\beta_1\),但是改變其方差估計為
\[\mathrm{Var}(\tilde \beta_1)=\frac{\sum x_i^2e_i^2}{(\sum x_i^2)^2}. \]
內生性
定義:如果一個或多個變量是內生解釋變量\(\mathrm{E}(\mu X_j)\ne 0\),則模型存在內生解釋變量問題。可分為同期相關和異期相關,主要討論同期相關。
產生原因:被解釋變量與解釋變量存在聯立因果關系,模型設定時遺漏了重要的解釋變量且這個解釋變量與模型中的解釋變量有同期相關性,解釋變量存在測量誤差。
后果:參數估計量是有偏且不一致的。
解決:
-
工具變量法:選取變量\(Z\)作為內生解釋變量\(X_j\)的工具變量,它是外生的,但與內生解釋變量需高度相關,同時不能與模型中其他變量有過高的相關性。
考慮總體矩條件,此時\(\mathrm{E}(X_j\mu)\ne 0\),故通過引入的外生變量\(Z\),有另一個矩條件\(\mathrm{E}(Z\mu)\),從而得到相應的樣本矩條件,推導可以得到
\[\tilde\beta_1=\frac{\sum z_iy_i}{\sum z_ix_i},\quad \tilde \beta_0=\bar{Y}-\tilde\beta_1\bar{X}. \]對多元矩陣模式,用\(Z\)替換掉\(X_j\)所在的列得到的新數據矩陣記作\(Z\),則\(\tilde\beta=(Z'X)^{-1}Z'Y\)。
工具變量法小樣本下仍然有偏,大樣本下卻是一致的。局限性在於,一個內生變量只能有一個工具變量。
-
兩階段最小二乘法是對工具變量法的推廣,可以應用於一個內生解釋變量尋找到多個工具變量的情形。
第一階段,作工具變量解釋內生變量的回歸:
\[\hat X_i=\hat \alpha_0+\hat \alpha_1Z_i, \]第二階段,用\(\hat X_i\)代入\(X_i\)放回原模型回歸:
\[Y_i=\beta_0+\beta_1\hat X_{i}+\mu_i,\\ \tilde\beta_1=\frac{\sum y_iz_i}{\sum x_iz_i}. \]注意,在第一階段中,如果模型中含有其他的外生變量,要將其他外生變量加入回歸,這適用於多元回歸的情形。
檢驗:
-
解釋變量的內生性檢驗,使用豪斯曼檢驗:模型中,\(X\)的外生性未知,但明確知道\(Z_1\)外生,即
\[Y_i=\beta_0+\beta_1X_i+\beta_2Z_{i1}+\mu_i, \]如果\(X\)是內生變量,則需尋找一外生變量\(Z_2\)作為工具變量,並對原模型進行工具變量法估計,看兩者差異是否顯著,如果顯著差異,就說明\(X\)內生。
第一步:類似2SLS,作輔助回歸
\[X_i=\alpha_0+\alpha_1Z_{i1}+\alpha_2Z_{i2}+\nu_i, \]得到殘差項\(\hat \nu_i\),並把殘差項加入原模型,即
\[Y_i=\beta_0+\beta_1X_i+\beta_2Z_{i1}+\delta\hat\nu_i+\varepsilon_i. \]如果認為\(X\)外生,那么第一步輔助回歸應當沒有什么幫助,所以原假設是\(\delta=0\),如果拒絕該假設,就認為\(X\)是內生變量。
-
過度識別約束檢驗:當一個內生解釋變量找到多於一個的工具變量時,需對改組工具變量的外生性進行檢驗,其檢驗思路依然是2SLS。模型中\(X\)內生,\(Z\)外生:
\[Y_i=\beta_0+\beta_1X_i+\beta_2Z_i+\mu_i, \]找到了\(X\)的兩個工具變量\(Z_1,Z_2\),先作初始回歸
\[Y_i=\tilde\beta_0+\tilde\beta_1X_i+\tilde\beta_2Z_i+\mu_i, \]得到殘差序列\(\hat\mu_i\),將殘差序列用“認定的”外生變量\(Z,Z_1,Z_2\)輔助回歸
\[\tilde\mu_i=\delta_0+\delta_1Z_{i1}+\delta_2Z_{i2}+\delta_3Z_i+\varepsilon_i, \]記該回歸的可決系數是\(R^2\),則在所有工具變量為外生變量的假設下\(J=nR^2\sim \chi^2(1)\),這里自由度是“多出來的”工具變量數。
模型設定偏誤
產生原因主要有兩大類:相關變量的遺漏與無關變量的誤選,錯誤的函數形式。
遺漏相關變量的后果:最小二乘估計量有偏,在大樣本下不一致。
誤選無關變量的后果:最小二乘估計量無偏且一致,但是方差估計會增大。
一般性設定偏誤檢驗:RESET檢驗,先作普通最小二乘法得到預測序列\(\hat Y_i\),加入預測序列的高次項回歸:
再使用受約束檢驗判斷\(\gamma_1=\gamma_2=0\)的原假設,如果拒絕了該假設,則模型出現了設定偏誤。
序列相關性
定義:如果存在\(\mathrm{E}(\mu_i\mu_j)\ne 0\),就說明存在序列相關性;如果僅有\(\mathrm{E}(\mu_i\mu_{i+1})\ne 0\),就說明存在一階序列相關。
產生原因:經濟變量固有的慣性,模型的設定偏誤,數據的“編造”。
后果:參數估計量非有效,檢驗失去意義,預測功能失效。在一階自相關\(X_{t}=\rho X_{t-1}+\mu_t\)假定下,參數估計量實際的方差是
檢驗:
-
圖示檢驗法:作\(e_t-t\)圖或者\(e_t-e_{t-1}\)圖輔助判斷。
-
回歸檢驗法:對\(e_t=\rho e_{t-1}+\varepsilon_t\),\(e_t=\rho_1e_{t-1}+\rho_2e_{t-2}+\varepsilon_t\)等回歸方程逐一檢驗,比較盲目。
-
杜斌-瓦森(DW)檢驗法:DW檢驗法有較多限制,需要解釋變量\(X\)非隨機、\(\mu_t\)為一階自相關形式、回歸模型中不含滯后應變量\(Y_{t-1}\),回歸模型含有截距項四大基本假設,對\(\mu_t=\rho\mu_{t-1}+\varepsilon\)構造假設檢驗\(\rho=0\),並構造DW統計量為
\[\mathrm{D.W.}=\frac{\sum\limits_{t=2}^{n}(e_t-e_{t-1})^2}{\sum\limits_{t=1}^{n}e_t^2}\in[0,4]. \]需根據樣本容量\(T\)和解釋變量數目\(k\)查\(\mathrm{D.W.}\)分布表,得到臨界值\(d_{L}\)和\(d_{U}\),判斷自相關狀態:
- \(0<\mathrm{D.W.}<d_{L}\),存在自相關。
- \(d_{U}<\mathrm{D.W.}<4-d_{U}\),無自相關。
- \(4-d_{L}<\mathrm{D.W.}<4\),存在負自相關。
- 其他情況下不能確定。
事實上,\(\mathrm{D.W.}\approx 2(1-\rho)\)。
-
拉格朗日乘數檢驗:考慮一般的\(p\)階序列相關\(\mu_t=\mu_1\mu_{t-1}+\rho_2\mu_{t-2}+\cdots+\rho_p\mu_{t-p}+\varepsilon_t\),檢驗受約束回歸方程:
\[Y_t=\beta_0+\beta_1X_{t1}+\cdots+\beta_kX_{tk}+\rho_1\mu_{t-1}+\cdots\rho_p\tilde \mu_{t-p}+\varepsilon_t,\\ H_0:\rho_1=\cdots=\rho_p=0, \]對此方程常使用拉格朗日乘數檢驗,但是\(\mu\)是不可觀測的,只能對原模型構造回歸,使用殘差序列:\(\tilde e_t=Y_t-\hat Y_t\),從而對此輔助5回歸有
\[Y_t=\beta_0+\beta_1X_{t1}+\cdots+\beta_kX_{tk}+\rho_1\tilde e_{t-1}+\cdots+\rho_p\tilde e_{t-p}+\varepsilon_t, \]計算其可決系數\(R^2\),有\(\mathrm{LM}=nR^2\sim \chi^2(p)\)。
解決:
-
廣義最小二乘法。
-
廣義差分法:若原模型存在
\[\mu_t=\rho_1\mu_{t-1}+\mu_2\rho_{t-2}+\cdots+\rho_p\mu_{t-p}+\varepsilon_t, \]作廣義差分變換
\[\begin{aligned} &\quad Y_t-\rho_1Y_{t-1}-\cdots-\rho_pY_{t-p}\\ &=\beta_0(1-\rho_1-\cdots-\rho_p)+\beta_1(X_{t1}-\rho_1X_{t-1,1}-\cdots-\rho_pX_{t-p,1})\\ &\quad +\cdots+\beta_k(X_{tk}-\rho_1X_{t-1,k}-\cdots-\rho_pX_{t-p,k})+\varepsilon_t. \end{aligned} \]為估計\(\rho_t\),常使用科克倫-奧科特迭代法。
廣義差分法損失了一定的樣本數,在一階序列相關情況下,對損失的第一次觀測值可進行如下的普萊斯-溫斯特變換:
\[Y_1^*=\sqrt{1-\rho^2}Y_1,\quad X_{1j}^*=\sqrt{1-\rho^2}X_{1j}. \] -
序列相關穩健標准誤法:用參數估計量的正確標准差進行替換,即使用
\[\mathrm{Var}(\hat\beta_1)=\frac{\sigma^2}{\sum x_t^2}+\frac{2\sigma^2}{\sum x_t^2}\left[\rho\frac{\sum\limits_{t=1}^{T-1}x_tx_{t+1}}{\sum x_t^2}+\rho^2\frac{\sum\limits_{t=2}^{T-2}x_tx_{t+2}}{\sum x_t^2}+\cdots+\rho_{T-1}\frac{x_1x_{T}}{\sum x_t^2} \right]. \]進行計算。
時間序列
平穩序列與白噪聲
平穩序列檢驗的原因:時間序列的平穩性可以替代隨機抽樣假定;平穩時間序列可以減少虛假回歸現象。
平穩時間序列:\(\mathrm{E}(X_t)=\mu\),\(\mathrm{Var}(X_t)=\sigma^2\),\(\mathrm{Cov}(X_t,X_{t+k})=\gamma_k\),就稱其為平穩過程。
-
自相關函數:\(\rho_k=\dfrac{\gamma_k}{\gamma_0}\)。
-
樣本自相關函數:注意分子和分母項數的不同,這是為了樣本自相關函數更快地收斂。
\[r_k=\frac{\sum\limits_{t=1}^{n-k}(X_t-\bar{X})(X_{t+k}-\bar{X})}{\sum\limits_{t=1}^{n}(X_t-\bar{X})^2}. \]
白噪聲過程檢驗(Bartlett):如果時間序列由白噪聲過程生成,則對所有\(k>0\),樣本自相關系數近似服從均值為\(0\),方差為\(1/n\)的正態分布,\(n\)為樣本數。可以檢驗
該統計量近似服從\(\chi^2(m)\),\(m\)為所選擇的滯后期長度,如果\(Q_{\mathrm{LB}}\)大於臨界值,就拒絕所有\(\rho_k\)同時為\(0\)的假設,認為此過程不是白噪聲過程。
迪基-福勒(DF)檢驗:判斷\(X_t=\rho X_{t-1}+\mu_t\)是否具有單位根\(\rho=1\),即對下式作回歸
檢驗是否有\(\delta=0\)。但構造的統計量\(\dfrac{\hat\delta}{S_{\hat\delta}}\)不服從\(t(n-2)\)分布而服從\(\mathrm{DF}\)分布,需要查\(\mathrm{DF}\)分布表以確定是否應當拒絕\(\delta=0\)的假設。如果\(t\)統計量足夠小(因為\(\delta\)一般是不能大於\(0\)的,所以是單側檢驗),就拒絕原假設\(\delta=0\),認為時間序列不存在單位根,是平穩的。
ADF檢驗(擴充的DF檢驗):支持更高階的自回歸過程,且能夠代表某種趨勢,它包括下面三個模型:
這三個模型檢驗的原假設都是\(\delta=0\),並且對三個模型計算出\(t\)統計量后,需查詢各自的\(\mathrm{ADF}\)臨界值表。在實行檢驗時常采用拉格朗日乘數檢驗確定滯后期\(m\)。實際檢驗時從第三個模型開始,然后是第二個模型,然后是第一個模型,何時拒絕了原假設就停止檢驗,否則需要繼續檢驗;從模型三轉到模型二時,需檢驗\(\beta=0\)是否成立,從模型二轉到模型一時,需要檢驗\(\alpha=0\)是否成立。
協整關系
單整:若一個時間序列模型經過\(d\)次差分變得平穩,則稱此序列\(d\)階單整,記作\(I(d)\)。
協整:若一系列時間序列\((X_{1t},\cdots,X_{kt})\)都是\(d\)階單整的,且存在向量\(\alpha=(\alpha_1,\cdots,\alpha_k)\),使得\(Z_t=\alpha X_t'\sim I(d-b)\),這里\(b>0\),即單整階數下降,就認為序列\((X_{1t},\cdots,X_{kt})\)是\((d,b)\)階協整,協整向量是\(\alpha\)。主要探究兩個時間序列協整的情況。
長期穩定關系:兩個變量雖然各有長期波動規律,但如果它們\((d,d)\)階協整,則它們之間存在長期穩定的比例關系。
協整關系使用EG檢驗:檢驗兩個\(I(1)\)序列是否\((1,1)\)協整。
-
第一步用普通最小二乘法估計,並計算非均衡誤差(即殘差),即
\[\hat{Y}_t=\hat\alpha_0+\hat\alpha_1X_t,\\ e_t=Y_t-\hat{Y}_t. \] -
第二步,檢驗\(e_t\)的單整性。如果\(e_t\)平穩,即\(I(0)\),就認為\(Y_t\)和\(X_t\)是\((1,1)\)階協整;否則認為\(X_t,Y_t\)不存在協整關系。平穩性檢驗使用DF檢驗或者ADF檢驗,一般使用模型一,即
\[\Delta e_t=\delta e_{t-1}+\sum_{i=1}^{p}\theta_i\Delta e_{t-i}+\varepsilon_t.\\ H_0:\delta=0. \]這里計算出\(\delta\)對應的\(t\)統計量的值后,需要查雙變量協整ADF檢驗臨界值表,它比DF檢驗和ADF檢驗的臨界值還要小。
協整關系的說明:協整方程不一定是均衡方程。
- 協整方程具有統計意義,均衡方程具有經濟意義。
- 均衡方程應包含均衡系統中所有序列,而協整方程中可以只包含其中的一部分。
- 協整方程只要求隨機項平穩,而均衡方程要求隨機項是白噪聲。
- 不能由協整關系導出均衡關系,只能用協整關系檢驗均衡關系。
誤差修正模型
誤差修正模型:誤差修正模型是一種具有特定形式的計量經濟學模型,它將當期的變化\(\Delta Y_t\)分成三部分:當期輸入\(\Delta X_t\)的影響,上一期誤差\(\mathrm{ecm}_{t-1}\)的影響(\(X_t\)與\(Y_t\)之間的關系),完全隨機的輸入\(\mu_t\)。其表現形式為
-
\((1,1)\)階分布滯后形式:
\[Y_t=\beta_0+\beta_1X_t+\beta_2X_{t-1}+\delta Y_{t-1}+\mu_t,\\ Y_t-Y_{t-1}=\beta_0+\beta_1(X_{t}-X_{t-1})+(\beta_1+\beta_2)X_{t-1}+(\delta-1)Y_{t-1}+\mu_t,\\ \Delta Y_{t}=\beta_1\Delta X_t-(1-\delta)\left(Y_{t-1}-\frac{\beta_1+\beta_2}{1-\delta}X_{t-1}-\frac{\beta_0}{1-\delta} \right)+\mu_t,\\ \Delta Y_t=\beta_1\Delta X_t-\lambda \cdot \mathrm{ecm}_{t-1}+\mu_t. \] -
\((2,1)\)階分布滯后形式:
\[\begin{aligned} Y_t&=\beta_0+\beta_1X_t+\beta_2X_{t-1}+\delta_1Y_{t-1}+\delta_2Y_{t-2}+\mu_t,\\ Y_t-Y_{t-1}&=\beta_0+\beta_1(X_t-X_{t-1})+(\beta_1+\beta_2)X_{t-1}\\ &\quad -\delta_2(Y_{t-1}-Y_{t-2})+(\delta_1+\delta_2-1)Y_{t-1}+\mu_t,\\ \Delta Y_{t}&=\beta_1\Delta X_t-\delta_2\Delta Y_{t-1}\\ &\quad -(1-\delta_1-\delta_2)\left(Y_{t-1}-\frac{\beta_0}{1-\delta_1-\delta_2}+\frac{\beta_1+\beta_2}{1-\delta_1-\delta_2}X_{t-1} \right)+\mu_t\\ &=\beta_1\Delta X_t-\delta_2\Delta Y_{t-1}-\lambda\cdot \mathrm{ecm}_{t-1}+\mu_t. \end{aligned} \] -
其他階的分布滯后模型,可以通過引入更多的歷史差分項來達到。
對長期均衡模型\(\ln Y_t=\alpha_0+\alpha_1\ln X_t+\mu_t\)中,\(\alpha_1\)的經濟意義是長期彈性;對短期非均衡模型(即\((1,1)\)階分布滯后形式)\(\beta_1\)的經濟意義是短期彈性。一般情況下\(\lambda\in(0,1)\),代表了長期非均衡誤差對\(Y_t\)的控制。
格蘭傑表述定理:如果\(X,Y\)是協整的,則它們之間的短期非均衡關系總能由一個誤差修正模型表述,即
建立誤差修正模型可使用EG兩步法:
- 進行協整回歸,檢驗變量間的協整關系,估計協整向量。
- 若協整性存在,則將第一步求到的殘差作為非均衡誤差項\(e_t\)加入誤差修正模型中,並用普通最小二乘法估計參數。即令\(e_{t-1}=\mathrm{ecm}_{t-1}\),需注意,如果\(e_{t-1}\)前面的參數為正,則模型必定是錯誤的。
格蘭傑因果關系檢驗
格蘭傑因:若在包含了\(X,Y\)的過去信息的條件下,對變量\(Y\)的預測效果要優於只單獨由\(Y\)的過去信息進行的預測效果,即\(X\)的歷史信息有助於解釋\(Y\)的將來變化,就認為變量\(X\)是引致變量\(Y\)的格蘭傑因。
具體對下列模型:
檢驗\(\alpha_1=\cdots=\alpha_m=0\),可以知道\(X\)是否對\(Y\)有影響;檢驗\(\lambda_1=\cdots=\lambda_m=0\),可以知道\(Y\)是否對\(X\)有影響。
在實際應用中,有幾個需要考慮的問題:
- 滯后期長度的選擇。
- 時間序列的平穩性問題。
- 樣本容量問題。
- 格蘭傑因果關系檢驗是必要性檢驗,而不是充分性檢驗。
stata代碼
最小二乘法
reg y x1 x2 // 回歸
predict y_hat // 得到估計結果
predict e,r // 得到殘差序列
estat ic // 計算信息准則統計量
adjust x1=1 x2=1, se ci level(95) // 預測均值、標准誤、置信區間
adjust x1=1 x2=1, stdf ci level(95) // 預測個別值、標准誤、置信區間
test x1 x2 // 檢驗聯合假設
test x1=0 // 單變量檢驗
test x1+x2=1 // 約束F檢驗
constraint define 1 x1+x2=1
cnsreg y x1 x2, constraints(1) // 受約束回歸
兩階段最小二乘法
reg lnq lny lnp // 原回歸
ivregress 2sls lnq lny (lnp=tax) // 工具變量法,只有一個工具變量
ivregress 2sls lnq lny (lnp=tax taxs) // 兩階段最小二乘法
hausman tsls ols // 豪斯曼檢驗
廣義差分法
tsset year // 設定時間序列
reg y x
estat dwatson // DW檢驗
prais y x // 廣義差分法估計,使用Prais-Winsten變換
prais y x, corc // 廣義差分法估計,不使用Prais-Winsten變換
newey y x, lag(1) // 序列相關穩健標准誤,一階自相關