條件Logistic回歸案例說明


在醫學研究中,為了控制一些重要的混雜因素,經常會把病例和對照按年齡,性別等條件進行配對,形成多個匹配組。各匹配組的病例數和對照人數是任意的,比如一個病例和若干個對照匹配即1:1,在醫學上稱作“1:1病歷對照研究”,常見還有1:M(M <=3),即1個病例和1或2或3個對照匹配。

 

病歷對照研究或者傾向得分匹配研究(一種將研究數據處理成‘隨機對照實驗數據’的方法)中常使用條件Logistic回歸進行分析。其與普通的二元logistic回歸區別在於,多出配對ID,即將配對組納入考慮范疇。

 

1、案例背景

某北方城市研究喉癌發病的危險因素,使用1:2匹配的病例對照研究方法進行調查。共有25對配對數據(每對3個,即25*3=75行數據)。現研究兩個影響因素分別是:是否吸煙和是否有癌症家族史。數據格式(部分)如下表:

 

 

提示:

條件logistic回歸時,數據中一定需要記錄配對編號,比如1:2的配對(1個病例配對2個對照,且共有20個組,組別編號從1到20,那么同時會有3個1,3個2,3個3,類似下去),而且在分析時將配對編號放入對應框中。

 

配對編號ID:共有25對配對,編號從1~25,每個數字會重復3次(分別對應病例或對照組);

Y是否患喉癌:數字1表示病例組即患喉癌,數字0表示對照組即沒有患喉癌;

X1是否吸煙:數字1表示吸煙,數字0表示不吸煙;

X2癌症家族史:數字1表示有家族患喉癌史,數字0表示沒有家族患喉癌史。

 

在做條件logistic回歸時,因變量只能為0和1二分類數據。數字中只能包括0和1,如果不是,可使用[數據處理]->[數據編碼]進行設置。

 

2、操作

本例子操作截圖如下:

 

3、結果分析

SPSSAU共輸出三個表格,分別是:“條件logit回歸模型似然比檢驗結果”,“條件logit回歸模型分析結果匯總”,“條件logit回歸模型分析結果匯總”。

 

① 第一個表格:條件logit回歸模型似然比檢驗結果

模型似然比檢驗,用於分析模型是否有效;

 

在分析上,首先需要模型通過似然比檢驗,其原定假設為不加入X和加入X模型無明顯差異,如果對應的p值小於0.05,意味着拒絕原假設,也即說明模型有意義。

從上表可知:此處模型檢驗的原定假設為:是否放入自變量(X1是否吸煙, X2癌症家族史)兩種情況時模型質量均一樣;從上表可知,模型拒絕原定假設(chi=6.319,p=0.042 <0.05),即說明本次構建模型時,放入的自變量具有有效性,本次模型構建有意義。

 

② 第二個表格:條件logit回歸模型分析結果匯總

包括模型的回歸系數,R方值等數據;

從上表可知:模型McFadden R方值為0.115,意味着是否吸煙, 癌症家族史共2項可解釋是否患喉癌的11.5%原因。

具體來看:X1是否吸煙的回歸系數值為1.243,並且呈現出0.05水平的顯著性(z=2.322,p=0.020 <0.05),意味着X1是否吸煙會對Y是否患喉癌產生顯著的正向影響關系。以及 (RR值,exp(b)值)為3.465(95% CI:1.214~9.892),意味着相對不吸煙群體,吸煙群體患喉癌的風險倍數會加大3.465倍。

X2癌症家族史的回歸系數值為-0.184,但是並沒有呈現出顯著性(z=-0.365,p=0.715>0.05),意味着是否有癌症家族史並不會對患喉癌產生影響。

 

4、總結

分析過程涉及以下幾個關鍵點:

(1)條件logistic回歸時,數據中一定需要記錄下配對編號,比如1:2的配對(1個病例配對2個對照,且共有20個組,組別編號從1到20,那么同時會有3個1,3個2,3個3,類似下去),而且在分析時將配對編號放入對應框中。

(2)條件logistic回歸時,因變量只能為0和1二分類數據,數字中只能包括0和1,如果不是,可使用數據處理->數據編碼進行設置。

 

「更多內容登錄SPSSAU官網了解」

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM