統計之路徑分析簡述


一般來講,無論是一元線性回歸還是多元線性回歸,都是研究自變量如何影響因變量的。然而在一些問題當中,自變量之間也有可能存在聯系。這種情況下,傳統的線性回歸模型就不適用了。路徑分析(Path Analysis)就可以解決這種問題。以下以住院的例子進行說明(圖1)。

圖1. 路徑分析的一個例子。

年齡、入院時的病情、住院天數都會影響最終住院的費用。然而,住院天數也受到年齡和入院時病情的影響。因此對於該問題不能用線性回歸模型進行分析。

路徑分析的基本思路是根據學科知識對每一個非完全自變量建立線性模型。本例中,年齡和入院時的病情就是完全自變量,被稱為外生變量(Exogenous Variable)。住院費用是本研究的因變量,被稱為最終結果變量(Ultimate Response Variable)。而住院天數對於住院費用來講是自變量,而對於年齡和入院時的病情來講卻又是因變量。對於這類變量,被稱為內生變量(Endogenous Variable)。

路徑分析建模時,首先對建立住院天數與年齡和入院時病情的線性模型,\(住院天數=年齡+入院時病情\)。然后再建立住院費用同其他變量之間的線性模型,\(住院費用=年齡+入院時病情+住院天數\)。通常在分析過程中,在不違反學科知識的情況下,會將模型中不顯著的變量取消以降低模型的復雜度。

另外在最終的結果當中,由於是對兩個模型同時進行分析,應當考慮標准化系數。至此,就可以得到外生變量和內生變量對於結果變量的影響了(圖2)。

圖2. 路徑分析的結果呈現。圖中的數值為模型中的標准化系數。數值是為了方便說明偽造的。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM