3.2 回歸參數的估計
與一元線性回歸類似,我們需要對回歸參數進行估計。估計的方法一般有兩種,最小二乘估計和最大似然估計。
3.2.1 回歸參數的普通最小二乘估計
多元線性回歸方程未知參數 \(\beta_0\),\(\beta_1\),\(\cdots\),\(\beta_p\) 仍然可以采用最小二乘估計。對於式 \((3.1.5)\) 表示的樣本回歸模型 \(\bm{y} = X \bm{\beta} + \bm{\varepsilon}\),所謂最小二乘法,就是尋找 \(\hat{\beta}_0\),\(\hat{\beta}_1\),\(\cdots\),\(\hat{\beta}_p\) 使離差平方和最小。
依照式 \((3.2.1)\) 求出的 \(\hat{\beta}_0\),\(\hat{\beta}_1\),\(\cdots\),\(\hat{\beta}_p\) 就稱為 \(\beta_0\),\(\beta_1\),\(\cdots\),\(\beta_p\) 的最小二乘估計。
從式 \((3.2.1)\) 中求 \(\hat{\beta}_0\),\(\hat{\beta}_1\),\(\cdots\),\(\hat{\beta}_p\) 是一個求極值問題,由於 \(Q\) 是關於 \(\beta_0\),\(\beta_1\),\(\cdots\),\(\beta_p\) 的非負二次函數,因而最小值總是存在,由費馬引理,極值點必須滿足下列方程組
以上方程組經整理后,得出用矩陣形式表示的正規方程組
移項得
當 \(X'X\) 可逆時,即得回歸參數的最小二乘估計
得到了經驗回歸方程。
3.2.3 回歸值與殘差
(1) 回歸值
在求出回歸參數的最小二乘估計后,可以用經驗回歸方程 \((3.2.5)\) 計算因變量的回歸值與殘差。
稱上式為觀測值 \(y_i\) 的回歸擬合值,簡稱回歸值或擬合值。
類似地,稱向量 \(\hat{\bm{y}}=X \hat{\bm{\beta}}=(\hat{y}_1,\cdots,\hat{y}_n)'\) 為因變量向量 \(\bm{y} = (y_1, \cdots, y_n)'\) 的回歸值。由式 \((3.2.4)\) 可得
由式 \((3.2.7)\) 可以看到,矩陣 \(X (X'X)^{-1} X'\) 的作用是把因變量向量 \(\bm{y}\) 變為擬合值向量 \(\hat{\bm{y}}\),從形式上看是給 \(\bm{y}\) 帶上了一頂“帽子”,因而形象地稱矩陣 \(X (X'X)^{-1} X'\) 為帽子矩陣,並記為 \(H\),於是有
關於帽子矩陣,我們詳細地做一些討論。
定理 3.2.1 帽子矩陣的性質
- 顯然帽子矩陣 \(H\) 是 \(n\) 階對稱矩陣,同時還是冪等矩陣,即有
\[H' = H, \quad H^2 = H \]
- 帽子矩陣 \(H\) 也是一個投影矩陣,從代數學觀點看,\(\bm{\hat{y}}\) 是 \(\bm{y}\) 在自變量 \(X\) 生成的空間上的投影,這個投影過程就是把 \(\bm{y}\) 左乘矩陣 \(H\),因此將 \(H\) 稱為投影陣,且具有投影陣的一般性質
\[(I - H)' =I - H, \quad (I - H)^2 = I - H \]
- 由對稱冪等陣的性質,帽子矩陣 \(H\) 的秩和跡相等,且有
\[\text{rank} (H) = \text{tr} (H)= p+1 \]
- 對設計矩陣 \(X\) 做分塊 \(X = \begin{bmatrix}\bm{1}_n& X^* \end{bmatrix}\),對帽子矩陣 \(H\) 有下式
\[H \bm{1}_n= \bm{1}_n, \quad H X^*= X^* \]
證明:證明帽子矩陣的第三點性質,根據跡的性質 \(\text{tr}(A B) = \text{tr}(B A)\),有
再證明帽子矩陣第四點性質,由
可得
證畢。
(2) 殘差
定義 \(y_i\) 的殘差
稱 \(\bm{e} = (e_1, \cdots, e_n)' = \bm{y} -\hat{\bm{y}}\) 為回歸殘差向量。將 \(\hat{\bm{y}} = H \bm{y}\) 帶入得,
記 \(\text{cov} (\bm{e}, \bm{e}) = (\text{cov}(e_i, e_j))_{n\times n}\) 為殘差向量 \(\bm{e}\) 的協方差陣,或稱為方差陣,記為 \(D(\bm{e})\),因而
由式 \((3.2.2)\) 可知,殘差滿足關系式
上式說明殘差平均值為 \(0\),殘差對每個自變量的加權平均值為 \(0\)。式 \((3.2.10)\) 用矩陣表示為
歸納殘差的各種性質如下:
定理 3.2.3 殘差的性質
- 殘差本身是樣本的函數,是一個統計量,因此可視為隨機向量,可以考慮協方差。令帽子矩陣 \(H\) 的主對角元素為 \(h_{ii}\)
\[\text{cov} (\bm{e}, \bm{e})= D(\bm{e}) = \sigma^2(I - H), \quad \text{var} (e_i) = D(e_i) = (1-h_{ii}) \sigma^2 \]
- 將式 \((3.2.10)\) 表成矩陣形式有
\[X' \bm{e} = 0 \]
- 考慮殘差的平方和 \(\text{SSE}\),有
\[E(\sum_{i=1}^n e_i^2) = \sum_{i=1}^n D(e_i) = (n - p - 1) \sigma^2 \]
- 考慮回歸參數 \(\hat{\bm{\beta}}\) 與殘差 \(\bm{e}\) 的協方差,有
\[\text{cov} (\hat{\bm{\beta}}, \bm{e}) = \bm{0} \]
- 隨機誤差項 \(\sigma^2\) 的無偏估計為
\[\hat{\sigma}^2 = \frac{1}{n - p - 1} \text{SSE} = \frac{1}{n - p - 1} (\bm{e}'\bm{e}) = \frac{1}{n - p - 1} \sum_{i=1}^n e_i^2 \]
- 由式 \((3.2.9)\) 可以求出殘差的期望
\[E(\bm{e}) = (I - H)X \bm{\beta} = \bm{0} \]
證明:證明第四點性質
證明第三、第五點性質,對第五點性質的式子兩邊求期望
第三點性質的證明已被包含在上述過程中。
證畢。
我們發現,在由正規方程組求 \(\hat{\bm{\beta}}\) 時,要求矩陣 \(X^{'}X\) 可逆,即要求該矩陣為非奇異矩陣,或要求 \(X^{'}X\) 為 \(p+1\) 階滿秩矩陣,也等價於要求
因此對矩陣 \(X\) 必須有
而矩陣 \(X\) 為 \(n \times (p+1)\) 階矩陣,於是應有
上述推出的結論恰好在多元線性回歸模型的基本假定中存在。這說明,要想用普通最小二乘估計法估計多元線性回歸模型的未知參數,樣本量必須不少於模型中參數的個數。
3.2.3 回歸參數的最大似然估計
對於多元線性樣本回歸模型
此時 \(\bm{y}\) 的概率分布為
然后可以得到似然函數
其中未知參數為 \(\bm{\beta}\) 和 \(\sigma^2\),最大似然估計就是選取使得似然函數 \(L\) 達到最大的 \(\bm{\beta}\) 和 \(\sigma^2\),對似然函數取自然對數,得到
顯然使式子 \((3.2.15)\) 達到最大,等價於下式達到最小。
故在正態假定下,回歸參數 \(\bm{\beta}\) 的最大似然估計與普通最小二乘估計是一樣的。
估計的回歸參數為
下面計算隨機誤差項的方差 \(\sigma^2\) 的最大似然估計。先計算對數似然函數的偏導
由此可得隨機誤差項的方差 \(\sigma^2\) 的最大似然估計為
盡管上式為 \(\sigma^2\) 的有偏估計,但它滿足一致性,即在大樣本情況下,是 \(\sigma^2\) 的漸進無偏估計。我們更經常使用的是無偏估計 \(\hat{\sigma}^2\)(見定理 \(3.2.3\))。