面板數據變系數模型
前言
在這一篇文章中,我們將某些影響因素的作用范圍擴大,這些因素不僅影響截距項的變動,而且也能影響到斜率項。因素的作用范圍就可能有一下幾種組合,單獨影響截距,單獨影響斜率,既影響截距又影響斜率,既不影響截距也不影響斜率(隨機效應)。因素又區分為兩類,時間因素與個體特質因素。推薦先閱讀數據分析-面板數據變截距模型 再閱讀本文。
為了方便理解,我們將包含個體特質與時間因素的面板回歸方程拆寫為:
\(Y_{it}=\alpha_0 +\alpha_i + \lambda_0 +\lambda_t + X_{it}' \beta_i+ X_{it}' \beta_t+ X_{it}' \beta_c + \varepsilon_{it}\)
\(\beta= \beta_i+ \beta_t + \beta_c\)
\(,i = 1,2,3,...,N;t=1,2,3,...,T\)
當然這里的\(\beta_t與\beta_i\)也可以像拆分 \(\alpha和\lambda\)一樣,拆分出均值和差異項
項目 | 含義 |
---|---|
\(i\) | 個體標志序數 |
\(t\) | 時間序數 |
\(X_{it}\) | 觀測變量,\(K*1\)向量,\((X_{1it,},X_{2it},..,X_{kit})'\) |
\(\beta_i\) | 隨個體特質而變動的參數,\(K*1\)向量, \((0,0,...,\beta_i,..0)'\) |
\(\beta_t\) | 隨時間而變動的參數,\(K*1\)向量, \((0,0,...,\beta_t,..0)'\) |
\(\beta_c\) | 不變動的參數,\(K*1\)向量, \((\beta_{1},\beta_{2},..0...,\beta_{k})'\) |
\(\beta\) | 總參數向量,\(K*1\)向量, \((\beta_{1},\beta_{2},...,\beta_i,...,\beta_t,...,\beta_{k})'\) |
\(\alpha_0\) | 個體效應在個體維度上的平均值 |
\(\alpha_i\) | 個體效應在個體維度上差異 |
\(\alpha_0+\alpha_i\) | 個體效應引起的截距項 |
\(\lambda_0\) | 時間效應在時間維度上的平均值 |
\(\lambda_t\) | 時間效應在時間維度上差異 |
\(\lambda_0 +\lambda_t\) | 時間效應引起的截距項 |
\(\varepsilon_{it}\) | 隨機擾動項 |
固定系數模型
模型
以截距項為個體固定效應,系數為個體固定效應:
\(Y_{it}=\alpha_0 +\alpha_i +X_{it}' \beta_i + X_{it}' \beta_c + \varepsilon_{it}\)
以截距項為個體固定效應,系數為時間固定效應:
\(Y_{it}=\alpha_0 +\alpha_i +X_{it}' \beta_t + X_{it}' \beta_c + \varepsilon_{it}\)
-
以截距項為個體固定效應,系數為個體固定效應,僅考慮第3個參數隨個體變化,舉例理解:
\(Y_{it}=\alpha_0 +\alpha_i + \beta_1 x_{1it}+\beta_2x_{2it}+ \beta_{3i}x_{3it} + \varepsilon_{it}\)
其中\(x_{1it} 表示第i個個體在t時刻的第1個變量值, \beta_1表示第1個變量前的參數\)
其中\(x_{2it} 表示第i個個體在t時刻的第2個變量值, \beta_2表示第2個變量前的參數\)
其中\(x_{3it} 表示第i個個體在t時刻的第3個變量值, \beta_{3i}表示依賴於第i個個體特質(第i個個體特質是個體分類的類別,表示個體差異影響x_3的斜率)、第3個變量前的參數\) -
以截距項為個體固定效應,系數為時間固定效應,僅考慮第3個參數隨時間變化,舉例理解:
\(Y_{it}=\alpha_0 +\alpha_i + \beta_1 x_{1it}+\beta_2x_{2it}+ \beta_{3t}x_{3it} + \varepsilon_{it}\)
其中\(x_{1it} 表示第i個個體在t時刻的第1個變量值, \beta_1表示第1個變量前的參數\)
其中\(x_{2it} 表示第i個個體在t時刻的第2個變量值, \beta_2表示第2個變量前的參數\)
其中\(x_{3it} 表示第i個個體在t時刻的第3個變量值, \beta_{3t}表示依賴於第t個時段特質(第t個時段是依據時間段分類的類別,表示時間段變動影響x_3的斜率)、第3個變量前的參數\)
估計方法
- 最小二乘虛擬變量法(LSDV)
引入虛擬變量進行回歸
舉例,以截距項為個體固定效應,系數為個體固定效應:
考慮\(\beta_2 與 \beta_3\)受到性別的影響
\(Y_{it}=\alpha_0 +\alpha_i + \beta_1 x_{1it}+\beta_{2i}x_{2it}+ \beta_{3i}x_{3it} + \varepsilon_{it}\)
\(=\alpha_0 +\alpha_i +\beta_1 x_{1it}+(\beta_{2}x_{2it}+ \gamma_1 x_{2it}*D_1+ \gamma_2 x_{2it}*D_2)+( \beta_{3}x_{3it} + \eta_1 x_{3it}*D_1+\eta_2 x_{3it}*D_2)+ \varepsilon_{it}\)
\(=\alpha_0 +\alpha_i +\beta_1 x_{1it}+( \gamma_{3}x_{2it}*D_3+ \gamma_1 x_{2it}*D_1+ \gamma_2 x_{2it}*D_2)+ (\eta_{3}x_{3it}*D_3 + \eta_1 x_{3it}*D_1+\eta_2 x_{3it}*D_2)+ \varepsilon_{it}\)
設置虛擬變量:
\(D_1=\begin{cases} 1 &\text{if } 第i個個體性別為男性 \\ 0 &\text{if } 第i個個體性別為其他 \end{cases}\)
\(D_2=\begin{cases} 1 &\text{if } 第i個個體性別為女性 \\ 0 &\text{if } 第i個個體性別為其他 \end{cases}\)
\(D_3=\begin{cases} 1 &\text{if } 第i個個體性別為中性 \\ 0 &\text{if } 第i個個體性別為其他 \end{cases}\)
注意:這里引入m-1個虛擬變量與m個虛擬變量的兩種方式等價。
隨機系數模型
這個模型是有局限性的:模型多多少少會忽略一些解釋變量,因此會導致截距項與解釋變量相關。所以說模型設置為個體固定效應的模型很正常。隨機變系數效應模型的截距項也應該是隨機的,截距項如果不是隨機的最好不要用隨機變系數效應模型。
模型舉例:
Swamy隨機模型:
\(Y_i=X_i\tilde{\beta_i}+\varepsilon_i,i=1,2,...,N\)
\(\tilde{\beta_i}=\beta_0+\beta_i\)
\(E(\beta_i)=0_{k *1},\)
\(E(\beta_i\beta_j')=\begin{cases} \Delta_i &\text{ }i=j \\ 0 &\text{ } i \neq j \end{cases}\);
\(E(X_{it}'\beta_i)=0\);
\(E(\varepsilon_i\varepsilon_j')=\begin{cases} \sigma_i &\text{ }i=j \\ 0 &\text{ } i \neq j \end{cases}\);
模型設定檢驗
由於我們不知道模型中哪些變量的系數是變動的,所以需要依據檢驗是否某個變量的系數是變動的
- 數據量很大,可以考慮全部變量系數變化
- 依次從全部變量系數不同,m-1個系數不同,m-2個系數不同,...,1個系數不同逐個檢驗(此方法用於變量個數很多或者虛擬變量個數很多的情形)
LR檢驗
\(Y_{it}=\alpha_0 +\alpha_i +\beta_1 x_{1it}+(\beta_{2}x_{2it}+ \gamma_1 x_{2it}*D_1+ \gamma_2 x_{2it}*D_2)+( \beta_{3}x_{3it} + \eta_1 x_{3it}*D_1+\eta_2 x_{3it}*D_2)+ \varepsilon_{it}\)
原假設:\(\gamma_1=\gamma_2=\eta_1=\eta_2=0\);(變量的系數不變動)
備擇假設:\(\gamma_1,\gamma_2,\eta_1,\eta_2\)不全為0;(變系數模型)
LR檢驗的無約束回歸方程(備擇假設成立):
\(Y_{it}=\alpha_0 +\alpha_i +\beta_1 x_{1it}+(\beta_{2}x_{2it}+ \gamma_1 x_{2it}*D_1+ \gamma_2 x_{2it}*D_2)+( \beta_{3}x_{3it} + \eta_1 x_{3it}*D_1+\eta_2 x_{3it}*D_2)+ \varepsilon_{it}\)
計算\(lnL_u\)
LR檢驗的約束回歸方程(原假設成立):
\(Y_{it}=\alpha_0 +\alpha_i + \beta_1 x_{1it}+\beta_{2}x_{2it}+ \beta_{3}x_{3it} + \varepsilon_{it}\)
計算\(lnL_r\)
Swamy檢驗
\(Y_i=X_i\tilde{\beta_i}+\varepsilon_i,i=1,2,...,N\)
\(\tilde{\beta_i}=\beta_0+\beta_i\)
\(E(\beta_i)=0_{k *1},\)
原假設:\(\beta_0=\beta_1=\beta_2=\beta_3=...=\beta_N\) (不變系數)
備擇假設:\(\beta_0,\beta_1,\beta_2,\beta_3,...,\beta_N\)不全相等(變系數)
- 同方差\(var(\varepsilon_i)=\sigma_\varepsilon^2\)
服從F分布 - 異方差\(var(\varepsilon_i)=\sigma_i^2\)
檢驗統計量為 \(Sw=\displaystyle\sum_{i=1}^N\frac{(\hat\beta_i-\hat\beta_0^*)'X_i'X_i(\hat\beta_i-\hat\beta_0^*)}{\hat\sigma_i^2}\xrightarrow[]{d}\chi^2((N-1)k)(給定N;T\xrightarrow{} \infty時 )\)
\(\hat\beta_0^*=(\displaystyle\sum_{i=1}^N\hat\sigma_i^2X_i'X_i)^{-1}(\displaystyle\sum_{i=1}^N\hat\sigma_i^2X_i'Y_i)\)
模型檢驗步驟
固定效應
LR逐次檢驗:
-
原假設:混合回歸模型(截距與斜率都不變)
備擇假設:截距項與斜率項(k個變量)發生變化
此時:不拒絕原假設,建立混合回歸模型,檢驗結束;拒絕原假設,截距項與斜率項之中至少有一項在變化,因此進入下一步檢驗。 -
引入截距項的約束函數,驗證是否成立
原假設:變量的斜率變化 (約束條件成立)
備擇假設:截距項、變量的斜率變化(約束條件不成立)
此時:不拒絕原假設,認為截距項不變。接下來要檢驗哪些變量的斜率發生變化;拒絕原假設,認為截距項變化,接下來需要檢驗截距項隨時點變化、個體變化、個體時點變化,以及哪些變量的斜率發生變化。 -
在上一步原假設的基礎上在引入任意k-1個關於變量系數的約束條件,有1個變量系數自由另外的k-1個約束條件的,認為這1個變量系數為模型唯一變動的變量系數,否則認為至少有2個變量系數變動。
原假設:個體FX變截距,考察其中一個變量變化,另外k-1個變量不發生變化。
備擇假設:個體FX變截距,至少有兩個變量系數變化。
此時:不拒絕原假設,我們認為個體FE變截距,且只有一個變量斜率發生變動。檢驗結束。
拒絕原假設,認為截距項發生變動,並且k-1個變量的斜率中至少有一個會變。繼續檢驗。 -
減少1個約束條件個數,重復第三步檢驗。
隨機效應原假設:混合模型
備擇假設:截距項、所有變量(k個變量)的斜率都是隨機效應。
此時:若不拒絕原假設,表明建立混合(pool)模型,檢驗到此結束。
若拒絕原假設,建立隨機系數模型。
注意:隨機系數模型的截距項也應該是隨機效應。