spss logistic回歸分析結果如何分析


spss logistic回歸分析結果如何分析

如何用spss17.0進行二元和多元logistic回歸分析

一、二元logistic回歸分析

二元logistic回歸分析的前提為因變量是可以轉化為0、1的二分變量,如:死亡或者生存,男性或者女性,有或無,Yes或No,是或否的情況。

下面以醫學中不同類型腦梗塞與年齡和性別之間的相互關系來進行二元logistic回歸分析。

(一)數據准備和SPSS選項設置

第一步,原始數據的轉化:如圖1-1所示,其中腦梗塞可以分為ICAS、ECAS和NCAS三種,但現在我們僅考慮性別和年齡與ICAS的關系,因此將分組數據ICAS、ECAS和NCAS轉化為1、0分類,是ICAS賦值為1,否賦值為0。年齡為數值變量,可直接輸入到spss中,而性別需要轉化為(1、0)分類變量輸入到spss當中,假設男性為1,女性為0,但在后續分析中系統會將1,0置換(下面還會介紹),因此為方便期間我們這里先將男女賦值置換,即男性為“0”,女性為“1”。 圖 1-1

第二步:打開“二值Logistic 回歸分析”對話框:

沿着主菜單的“分析(Analyze)→回歸(Regression)→二元logistic(Binary Logistic)”的路徑(圖1-2)打開二值Logistic 回歸分析選項框(圖1-3)。

如圖1-3左側對話框中有許多變量,但在單因素方差分析中與ICAS顯著相關的為性別、年齡、有無高血壓,有無糖尿病等(P<0.05),因此我們這里選擇以性別和年齡為例進行分析。

在圖1-3中,因為我們要分析性別和年齡與ICAS的相關程度,因此將ICAS選入因變量(Dependent)中,而將性別和年齡選入協變量(Covariates)框中,在協變量下方的“方法(Method)”一欄中,共有七個選項。采用第一種方法,即系統默認的強迫回歸方法(進入“Enter”)。 接下來我們將對分類(Categorical),保存(Save),選項(Options)按照如圖1-4、1-5、1-6中所示進行設置。在“分類”對話框中,因為性別為二分類變量,因此將其選入分類協變量中,參考類別為在分析中是以最小數值“0(第一個)”作為參考,還是將最大數值“1(最后一個)”作為參考,這里我們選擇第一個“0”作為參考。在“存放”選項框中是指將不將數據輸出到編輯顯示區中。在“選項”對話框中要勾選如圖幾項,其中“exp(B)的CI(X)”一定要勾選,這個就是輸出的OR和CI值,后面的95%為系統默認,不需要更改。


另外在“選項”對話框中,“輸出”一欄中,系統默認為“在每個步驟中”,這里更改為“在最后一個步驟中”,即:輸出結果將僅僅給出最終結果,而省略每一步的計算過程。由於我們采用強迫回歸,逐步回歸概率選項可以不管

此外還有一個選項需要說明。一是分類臨界值(Classification cutoff),默認值為0.5,即按四舍五入的原則將概率預測值化為0 或者1

。如果

將數值改為0.6,則大於等於0.6 的概率值才表示為1,否則為0。其情況余依此類推。二是最大迭代值(Maximum Iterations),規定系統運算的迭代次數,默認值為20 次,為安全起見,我們將迭代次數增加到50。原因是,有時迭代次數太少,計算結果不能真正收斂。三是模型中包括常數項(Include constant in model),即模型中保留截距。除了迭代次數之外,其余兩個選項均采用系統默認值。

完成后,點擊各項中“繼續(Continue)”按鈕。返回圖1-3,單擊“確定”按鈕。

(二)結果解讀

其他結果參照文章《利用SPSS進行Logistic回歸分析》中解讀,這里重點將兩點: 第一,分類變量編碼(圖1-7),由於這里包括性別分類變量,而我們對性別賦值為1和0,但在spss中系統會默認把我們的數值進行置換,即1→參數編碼0,0→參數編碼1,而最終輸出結果是以1來計算的,而0為參考數據。所以這也就是為什么我么之前要對研究組男性的賦值進行置換了。如果男性為1那么spss中最終輸出的將是女性的分析結果。

圖1-7

第二,最終輸出數據(圖1-8)在該結果中,Exp(B)即為文獻中提及的OR值,而EXP(B)的95%C.I.即為文獻中提及的CI值。其中Exp(B)表示某因素(自變量)內該類別是其相應參考類別具有某種傾向性的倍數。而有的文獻中提到的Crode OR和Adjust OR則分別為單因素優勢率(Crode odds ratio)和多因素優勢率(Adjust odds ratio),即僅對性

別單個變量的單因素分析或者對性別和年齡等多個變量進行多因素分析后所得到的不同結果。CI則為可信區間(Confidence interval)。Sig.即我們常說的P值,P<0.05為顯著(無效假說不成立,具有統計學意義),P>0.05為不顯著(無效假說成立,不具有統計學意義)。 二、多項(多元、多分類、Multinomial)logistic回歸分析

前面講的二元logistic回歸分析僅適合因變量Y只有兩種取值(二分類)的情況,當Y具有兩種以上的取值時,就要用多項logistic回歸(Mutinomial Logistic Regression)分析了。這種分析不僅可以用於醫療領域,也可以用於社會學、經濟學、農業研究等多個領域。如不同階段(初

一、初二、初三)學生視力下降程度,不同齲齒情況(輕度、中度、重度)下與刷牙、飲食、年齡的關系等。

下面我們以圖1-2中,對apoba1(ApoB/AI)項中數值做四分位數后,將病人的ApoB/AI的比值划分為低、較低、中、高四個分位后利用多項logistic回歸分析其與ICAS之間的相互關系。

首先來做四分位數,很多人在做四分位數的時候都是自己算出來的,其實在SPSS里面給出了做四分位數的程度即分析(Aanlyze)→描述統計(Descriptive Statistics)→頻率(Frequencies)。打如圖2-1開頻率對話框。將我們要分析的數值變量Apoba1選入到變量對話框中。 選擇統計量,按照圖2-2中勾選四分位數選項,其他選項按照自己需要勾選,然后點擊圖2-1中的確定按鈕,開始運算。在圖2-3中可以讀取我們的四分位數

值。圖中百分數表示的是對該變量做的四分位數的百分比,25表示前25%的,50表示前50%的,75表示前75%的。每一項對應的后面數值即為相應的四分位數,如0.5904,即為前25%的個體與后75%個體的分位數。

按照如上方法得出ApoB/AI的比率后我們可以把該比值划分為四個區間,即當ApoB/AI的比率<0.5904為低、當0.5904≤ApoB/AI的比率≤0.88時為較低、當0.89≤ApoB/AI的比率≤1.0886時為中,當ApoB/AI的比率>1.0886時為高。然后將這一划分如圖1-1中“四分位數”一項用分類數值表示即1代表低,2代表較低,3代表中,4代表高。這里還要強調的是我們要研究其與ICAS之間的相互關系,那么我們需要將其設為二分類變量,即是ICAS的情況為1,否則為0,但多項logistic回歸分析也會將1,0置換,所以我們需要在這里將我們需要研究的情況置換為0,然后將其他置換為1。下面就可以進行多項logistic回歸分析了。如圖

2-4打開多項logistic回歸分析對話框(圖2-5)。

如圖2-5所示,在”因變量”中選入剛才我們輸入的四分位數分類變量,在因子中輸入分類變量ICAS(這里一定是分類變量,可以是一個也可以是多個),在“協變量”中輸入數值變量如年齡(這里一定是數值變量,

可以是一個也可以是多個),但因本次沒有對年齡進行分析,僅對ICAS進行了單因素分析,所以我們把年齡移出協變量選項。

在SPSS中對因變量的定義是,如果因變量Y有J個值(即Y有J類),以其中一個類別作為參考類別,其他類別都同他相比較生成J-1個冗余的Logit變換模型,而作為參考類別的其模型中所有系數均為0。在SPSS中可以對所選因變量的參考類別進行設置,如圖2-5在因變量對話框下有一“參考類別”選項。點擊后會彈出圖2-6對話框。在該對話框中我們選中設定,輸入數值1,這代表我們以分類數值1所代表的類別作為參考類別,即最低數值作為參考類別。 單擊繼續。當然也可以選擇“第一類別”和“最后類別”,入選中分別表示以最低數值或最高數值作為參考類別。其他設置與二元Logistic分析相似,將我們要輸出的項勾選即可,點擊圖2-5中確定,輸出數據。 輸出數據基本與二元Logistic分析相似,我們重點講下最后一項“參考估計”,如圖2-7所示,其中參考類別為ICAS=1的分類情況,而其中的ICAS=0分為2、3、4三種,分別給出了ICAS=0時的數值。而其中Exp(B)(即OR值)表示某因素(自變量)內該類別是其相應參考類別具有某種傾向性的倍數。如Exp(B)=2.235時,即表示在較輕這一類別下ICAS患者數為其他類別(ECAS和NCAS)的2.235倍。這里面的顯著水平即為P值。數據分析培訓

這里要強調的是,一些文獻中在輸出數據的時候經常會給出“Referent(參考)”項,這里的Referent,即為我們這里所選的參考類別1,因為

1作為參考類別,所以其所有數值為0

,即無數據輸出。因此在文中需標注其為Referent。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM