廣義估計方程是一種研究縱向數據(比如重復測量數據,面板數據)的方法。
同一測量對象的多次測量數據結果之間很可能有着相關關系,如果不考慮數據之間的相關性會造成信息損失。常見的研究模型(比如線性回歸)都要求數據之間獨立,此時可使用廣義估計方程進行研究。
重復測量方差要求數據完整不能有缺失,但在實際研究中,有缺失數據較為普遍,此時也可以使用廣義估計方程進行研究。不同的是,重復測量方差是從差異關系角度分析,但廣義估計方程是從影響關系角度分析。
除此之外,重復測量方差要求因變量Y為定量連續數據,自變量X是定類數據;但是廣義估計方程時,因變量Y為定量數據或者二分類數據,也或者泊松分布,負二項分布數據均可,對自變量的數據類型也無特別要求,如果是定類數據直接做虛擬變量設置即可。
一、案例背景
為研究青少年牙齒發育情況與年齡,性別的關系,現收集27名兒童,他們分別在8,10,12,14歲共4個年齡時的牙齒長度指標(distance,垂體至翼上頜裂長度)。現在想研究不同性別兒童牙齒長度指標是否有着明顯的差異性。
明顯的,本研究數據為縱向數據即重復測量,同一對象測量了4個年齡段(還有一種縱向數據是比如同一對象測量不同的幾個部位),本份數據由於沒有缺失數據,因變量為定量數據,因而也可使用重復測量方差進行研究(年齡為組內項)。本案例使用GEE進行研究分析。
研究數據結構如下圖:

subjectID:標識具體是哪個研究對象,本次共有27名兒童,編號分別從1~27;
性別:標識研究對象的性別,“1”表示男性,“0”表示女性;
年齡:標識研究對象的測量時間點,分別為8,10,12和14歲這4個時間點進行測量,該項為組內項;
distance:牙齒長度指標“垂體至翼上頜裂長度”,該數據為定量連續數據,因此需要使用回歸模型。
二、理論說明
廣義估計方程涉及兩部分內容,一是模型的選擇,二是矩陣結構。
(1)模型的選擇
使用廣義估計方程首先要根據因變量Y的數據分布特征,選擇適合的模型。
- 如果因變量是定量連續數據,通常使用線性回歸模型;
- 如果因變量的二分類數據,只有數字0或1,那么可使用二元Logit或二元Probit回歸;
- 如果因變量服從泊松分布,可使用泊松回歸。如果因變量Y的數據特征有點類似泊松分布,但是均值與方差差異較大,則使選擇負二項回歸模型。

(2)矩陣結構
廣義估計方程GEE用於解決數據獨立性問題,矩陣結構正是解決此問題的具體方式。
等相關exchangeable:數據之間有着相關性,而且相關性相等,此種情況使用較多。
自相關autoregressive:數據之間有着相關性,而且相鄰時間點相關性越大,時間間隔越大相關性越小。
獨立independence:數據之間完全獨立,同一對象的不同測量數據之間沒有關系,此種情況相關於數據完全獨立,即數據確實是重復測量,但並沒有違反獨立性原則。使用較少,但可作為一種探索對比進行分析。

那么上述三種矩陣結構如何選擇呢?
通常的選擇辦法是分別進行此三種結構時的模型,並且記錄下QIC值,QIC值越小,此時就使用對應的矩陣結構模型。 在廣義估計方程中,事實上還有其它的矩陣結構,比如M-dependent,Unstructured等,使用相對較少。
三、操作
登錄SPSSAU,選擇【實驗/醫學研究】--【廣義估計方程】。

本例子使用廣義估計矩陣模型,由於因變量Y為定量連續數據,因此選擇回歸模型 ,並且暫使用默認的等相關exchangeable矩陣結構,操作如下圖:

由於性別使用數字1表示男性,數字0表示女性,已經是啞變量數據,並不需要進行處理;
年齡作為組內項可放入對應框中。
四、SPSSAU輸出結果
SPSSAU共輸出三個表格,分別是模型基本信息,模型回歸系數匯總和邊際效應分析結果。
(1)模型基本信息

上表格展示模型基本信息,包括每個研究對象subject的測量數量,本案例全部都是4,即都測量了4次;比如本次研究對象為27個,每個對象都有完整的4次重復測量數據,因此測量最小,最大或平均個數均為4。
同時展示鏈接函數(模型結構)為Linear即線性回歸模型,作業相關矩陣(矩陣結構)為等相關。QIC值為113.8。
(2)模型回歸系數

模型回歸系數:展示模型的回歸值等,結果中的OR值及OR 95%CI值,僅在二元logit,二元probit,泊松回歸或負二項回歸模型時才有意義;
從上表可知:性別的回歸系數值為2.321(z=3.096, p=0.002 <0.01),呈現出0.01水平的顯著性,意味着性別會對distance產生正向影響,即相對於女性而言,男性群體的distance牙齒長度明顯發育更長。
(3)邊際效應分析結果

邊際效應分析結果:此表格在計量研究中使用較多,通常可忽略。
邊際效應指X變化一單位時,Y帶來的幅度變化,該指標通常在計量經濟研究中使用較多;邊際效應結果在計量研究時,而且是使用線性回歸時會有一些用處。比如上表格中邊際效應dy/dx值為2.321,其代表性別增加一個單位(即從女性變化到男性時),因變量distance牙齒長度增加幅度為2.321。
「更多內容登錄SPSSAU官網了解」
