數據分析-面板數據變系數模型


面板數據變系數模型

前言

在這一篇文章中,我們將某些影響因素的作用范圍擴大,這些因素不僅影響截距項的變動,而且也能影響到斜率項。因素的作用范圍就可能有一下幾種組合,單獨影響截距,單獨影響斜率,既影響截距又影響斜率,既不影響截距也不影響斜率(隨機效應)。因素又區分為兩類,時間因素與個體特質因素。推薦先閱讀數據分析-面板數據變截距模型 再閱讀本文。

graph LR A[因素] --> B(時間因素) A --> C(個體特質因素) A-->A1[隨機因素]-->G1[影響截距] & H1[影響斜率] & i1[影響截距與斜率] & N1[不影響截距,斜率] B--> G2[影響截距] & H2[影響斜率] & i2[影響截距與斜率] & N2[不影響截距,斜率] C --> G[影響截距] & H[影響斜率] & i[影響截距與斜率] & N[不影響截距,斜率]

為了方便理解,我們將包含個體特質與時間因素的面板回歸方程拆寫為:
\(Y_{it}=\alpha_0 +\alpha_i + \lambda_0 +\lambda_t + X_{it}' \beta_i+ X_{it}' \beta_t+ X_{it}' \beta_c + \varepsilon_{it}\)
\(\beta= \beta_i+ \beta_t + \beta_c\)
\(,i = 1,2,3,...,N;t=1,2,3,...,T\)
當然這里的\(\beta_t與\beta_i\)也可以像拆分 \(\alpha和\lambda\)一樣,拆分出均值和差異項

項目 含義
\(i\) 個體標志序數
\(t\) 時間序數
\(X_{it}\) 觀測變量,\(K*1\)向量,\((X_{1it,},X_{2it},..,X_{kit})'\)
\(\beta_i\) 隨個體特質而變動的參數,\(K*1\)向量, \((0,0,...,\beta_i,..0)'\)
\(\beta_t\) 隨時間而變動的參數,\(K*1\)向量, \((0,0,...,\beta_t,..0)'\)
\(\beta_c\) 不變動的參數,\(K*1\)向量, \((\beta_{1},\beta_{2},..0...,\beta_{k})'\)
\(\beta\) 總參數向量,\(K*1\)向量, \((\beta_{1},\beta_{2},...,\beta_i,...,\beta_t,...,\beta_{k})'\)
\(\alpha_0\) 個體效應在個體維度上的平均值
\(\alpha_i\) 個體效應在個體維度上差異
\(\alpha_0+\alpha_i\) 個體效應引起的截距項
\(\lambda_0\) 時間效應在時間維度上的平均值
\(\lambda_t\) 時間效應在時間維度上差異
\(\lambda_0 +\lambda_t\) 時間效應引起的截距項
\(\varepsilon_{it}\) 隨機擾動項

固定系數模型

模型

以截距項為個體固定效應,系數為個體固定效應:
\(Y_{it}=\alpha_0 +\alpha_i +X_{it}' \beta_i + X_{it}' \beta_c + \varepsilon_{it}\)
以截距項為個體固定效應,系數為時間固定效應:
\(Y_{it}=\alpha_0 +\alpha_i +X_{it}' \beta_t + X_{it}' \beta_c + \varepsilon_{it}\)

  • 以截距項為個體固定效應,系數為個體固定效應,僅考慮第3個參數隨個體變化,舉例理解:
    \(Y_{it}=\alpha_0 +\alpha_i + \beta_1 x_{1it}+\beta_2x_{2it}+ \beta_{3i}x_{3it} + \varepsilon_{it}\)
    其中\(x_{1it} 表示第i個個體在t時刻的第1個變量值, \beta_1表示第1個變量前的參數\)
    其中\(x_{2it} 表示第i個個體在t時刻的第2個變量值, \beta_2表示第2個變量前的參數\)
    其中\(x_{3it} 表示第i個個體在t時刻的第3個變量值, \beta_{3i}表示依賴於第i個個體特質(第i個個體特質是個體分類的類別,表示個體差異影響x_3的斜率)、第3個變量前的參數\)

  • 以截距項為個體固定效應,系數為時間固定效應,僅考慮第3個參數隨時間變化,舉例理解:
    \(Y_{it}=\alpha_0 +\alpha_i + \beta_1 x_{1it}+\beta_2x_{2it}+ \beta_{3t}x_{3it} + \varepsilon_{it}\)
    其中\(x_{1it} 表示第i個個體在t時刻的第1個變量值, \beta_1表示第1個變量前的參數\)
    其中\(x_{2it} 表示第i個個體在t時刻的第2個變量值, \beta_2表示第2個變量前的參數\)
    其中\(x_{3it} 表示第i個個體在t時刻的第3個變量值, \beta_{3t}表示依賴於第t個時段特質(第t個時段是依據時間段分類的類別,表示時間段變動影響x_3的斜率)、第3個變量前的參數\)

估計方法

  • 最小二乘虛擬變量法(LSDV)
    引入虛擬變量進行回歸
    舉例,以截距項為個體固定效應,系數為個體固定效應:
    考慮\(\beta_2 與 \beta_3\)受到性別的影響
    \(Y_{it}=\alpha_0 +\alpha_i + \beta_1 x_{1it}+\beta_{2i}x_{2it}+ \beta_{3i}x_{3it} + \varepsilon_{it}\)
    \(=\alpha_0 +\alpha_i +\beta_1 x_{1it}+(\beta_{2}x_{2it}+ \gamma_1 x_{2it}*D_1+ \gamma_2 x_{2it}*D_2)+( \beta_{3}x_{3it} + \eta_1 x_{3it}*D_1+\eta_2 x_{3it}*D_2)+ \varepsilon_{it}\)
    \(=\alpha_0 +\alpha_i +\beta_1 x_{1it}+( \gamma_{3}x_{2it}*D_3+ \gamma_1 x_{2it}*D_1+ \gamma_2 x_{2it}*D_2)+ (\eta_{3}x_{3it}*D_3 + \eta_1 x_{3it}*D_1+\eta_2 x_{3it}*D_2)+ \varepsilon_{it}\)
    設置虛擬變量:
    \(D_1=\begin{cases} 1 &\text{if } 第i個個體性別為男性 \\ 0 &\text{if } 第i個個體性別為其他 \end{cases}\)
    \(D_2=\begin{cases} 1 &\text{if } 第i個個體性別為女性 \\ 0 &\text{if } 第i個個體性別為其他 \end{cases}\)
    \(D_3=\begin{cases} 1 &\text{if } 第i個個體性別為中性 \\ 0 &\text{if } 第i個個體性別為其他 \end{cases}\)
    注意:這里引入m-1個虛擬變量與m個虛擬變量的兩種方式等價。

隨機系數模型

這個模型是有局限性的:模型多多少少會忽略一些解釋變量,因此會導致截距項與解釋變量相關。所以說模型設置為個體固定效應的模型很正常。隨機變系數效應模型的截距項也應該是隨機的,截距項如果不是隨機的最好不要用隨機變系數效應模型。
模型舉例:
Swamy隨機模型:
\(Y_i=X_i\tilde{\beta_i}+\varepsilon_i,i=1,2,...,N\)
\(\tilde{\beta_i}=\beta_0+\beta_i\)
\(E(\beta_i)=0_{k *1},\)

\(E(\beta_i\beta_j')=\begin{cases} \Delta_i &\text{ }i=j \\ 0 &\text{ } i \neq j \end{cases}\);

\(E(X_{it}'\beta_i)=0\);

\(E(\varepsilon_i\varepsilon_j')=\begin{cases} \sigma_i &\text{ }i=j \\ 0 &\text{ } i \neq j \end{cases}\);

模型設定檢驗

由於我們不知道模型中哪些變量的系數是變動的,所以需要依據檢驗是否某個變量的系數是變動的

  • 數據量很大,可以考慮全部變量系數變化
  • 依次從全部變量系數不同,m-1個系數不同,m-2個系數不同,...,1個系數不同逐個檢驗(此方法用於變量個數很多或者虛擬變量個數很多的情形)

LR檢驗

\(Y_{it}=\alpha_0 +\alpha_i +\beta_1 x_{1it}+(\beta_{2}x_{2it}+ \gamma_1 x_{2it}*D_1+ \gamma_2 x_{2it}*D_2)+( \beta_{3}x_{3it} + \eta_1 x_{3it}*D_1+\eta_2 x_{3it}*D_2)+ \varepsilon_{it}\)
原假設:\(\gamma_1=\gamma_2=\eta_1=\eta_2=0\);(變量的系數不變動)
備擇假設:\(\gamma_1,\gamma_2,\eta_1,\eta_2\)不全為0;(變系數模型)

LR檢驗的無約束回歸方程(備擇假設成立):
\(Y_{it}=\alpha_0 +\alpha_i +\beta_1 x_{1it}+(\beta_{2}x_{2it}+ \gamma_1 x_{2it}*D_1+ \gamma_2 x_{2it}*D_2)+( \beta_{3}x_{3it} + \eta_1 x_{3it}*D_1+\eta_2 x_{3it}*D_2)+ \varepsilon_{it}\)
計算\(lnL_u\)
LR檢驗的約束回歸方程(原假設成立):
\(Y_{it}=\alpha_0 +\alpha_i + \beta_1 x_{1it}+\beta_{2}x_{2it}+ \beta_{3}x_{3it} + \varepsilon_{it}\)
計算\(lnL_r\)

Swamy檢驗

\(Y_i=X_i\tilde{\beta_i}+\varepsilon_i,i=1,2,...,N\)
\(\tilde{\beta_i}=\beta_0+\beta_i\)
\(E(\beta_i)=0_{k *1},\)
原假設:\(\beta_0=\beta_1=\beta_2=\beta_3=...=\beta_N\) (不變系數)
備擇假設:\(\beta_0,\beta_1,\beta_2,\beta_3,...,\beta_N\)不全相等(變系數)

  • 同方差\(var(\varepsilon_i)=\sigma_\varepsilon^2\)
    服從F分布
  • 異方差\(var(\varepsilon_i)=\sigma_i^2\)
    檢驗統計量為 \(Sw=\displaystyle\sum_{i=1}^N\frac{(\hat\beta_i-\hat\beta_0^*)'X_i'X_i(\hat\beta_i-\hat\beta_0^*)}{\hat\sigma_i^2}\xrightarrow[]{d}\chi^2((N-1)k)(給定N;T\xrightarrow{} \infty時 )\)
    \(\hat\beta_0^*=(\displaystyle\sum_{i=1}^N\hat\sigma_i^2X_i'X_i)^{-1}(\displaystyle\sum_{i=1}^N\hat\sigma_i^2X_i'Y_i)\)

模型檢驗步驟

固定效應

LR逐次檢驗:

  1. 原假設:混合回歸模型(截距與斜率都不變)
    備擇假設:截距項與斜率項(k個變量)發生變化
    此時:不拒絕原假設,建立混合回歸模型,檢驗結束;拒絕原假設,截距項與斜率項之中至少有一項在變化,因此進入下一步檢驗。

  2. 引入截距項的約束函數,驗證是否成立
    原假設:變量的斜率變化 (約束條件成立)
    備擇假設:截距項、變量的斜率變化(約束條件不成立)
    此時:不拒絕原假設,認為截距項不變。接下來要檢驗哪些變量的斜率發生變化;拒絕原假設,認為截距項變化,接下來需要檢驗截距項隨時點變化、個體變化、個體時點變化,以及哪些變量的斜率發生變化。

  3. 在上一步原假設的基礎上在引入任意k-1個關於變量系數的約束條件,有1個變量系數自由另外的k-1個約束條件的,認為這1個變量系數為模型唯一變動的變量系數,否則認為至少有2個變量系數變動。
    原假設:個體FX變截距,考察其中一個變量變化,另外k-1個變量不發生變化。
    備擇假設:個體FX變截距,至少有兩個變量系數變化。
    此時:不拒絕原假設,我們認為個體FE變截距,且只有一個變量斜率發生變動。檢驗結束。
    拒絕原假設,認為截距項發生變動,並且k-1個變量的斜率中至少有一個會變。繼續檢驗。

  4. 減少1個約束條件個數,重復第三步檢驗。

graph LR A[模型檢驗,約束全部系數與截距項] -- 原假設 --> B[混合回歸模型 : 截距與斜率都不變]-->B1[結束檢驗,建立混合回歸模型] A --備擇假設--> C[截距項和斜率項的k個變量斜率之中至少有一個發生變化,約束截距項] C --原假設--> C1[截距不變,變量的斜率變化]-->C11[引入k-1個約束,檢測那個斜率變化]--原假設-->C12[約束條件成立,檢測出,檢驗結束] C11--備擇假設-->C13[認為有兩個斜率變動,因此i減少約束條件個數] C13-->C11 C--備擇假設-->C2[截距項與變量的斜率變化] C2--原假設-->D1[截距項變化,一個變量斜率變化,其余k-1個變量斜率不變化]-->E1[檢驗結束,建立變截距,1個變量系數變化的模型] C2--備擇假設-->D2[截距項變化,所有的變量系數都發生變化,下一步檢驗減少約束條件個數] D2-->C2

隨機效應原假設:混合模型

備擇假設:截距項、所有變量(k個變量)的斜率都是隨機效應。
此時:若不拒絕原假設,表明建立混合(pool)模型,檢驗到此結束。
若拒絕原假設,建立隨機系數模型。
注意:隨機系數模型的截距項也應該是隨機效應。

建模步驟

graph LR A[輸入數據]-->B[描述性統計分析]-->C[面板單位根檢驗] C--數據非平穩-->D[面板協整分析] C--數據平穩-->E[變截距檢驗] & F[變系數檢驗] F-->F1[固定系數檢驗] F1--不拒絕原假設-->FA[系數不變] F1--拒絕原假設-->FB[系數變動] F-->F2[隨機系數檢驗] F2--不拒絕原假設-->FA1[系數不變] F2--拒絕原假設-->FB1[系數變動] E[F檢驗 or LR檢驗] --不拒絕原假設,意味着截距項不變動--> G[使用混合回歸] E --拒絕原假設,意味着截距項變動--> H[豪斯曼檢驗] H --不拒絕原假設--> L[選擇個體隨機效應模型] H --拒絕原假設--> M[選擇個體固定效應模型]


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM