一、問題與數據
研究者想要探索人群中不同性別者喜歡競技類或娛樂性體育活動是否有差異。研究者從學習運動醫學的學生中隨機招募50名學生,記錄性別並詢問他們喜歡競技類還是娛樂性活動,通過計算比值比來探索這一差異。
性別變量為gender,男性賦值為1,女性賦值為2;喜歡競技類運動的變量為comp,是賦值為1,否(即喜歡休閑類運動)賦值為2。部分數據如下圖顯示,左圖為原始數據,右圖為按性別和喜歡競技類運動與否統計的匯總數據。

二、對問題的分析
為計算比值比,需要滿足以下兩個假設:
1. 假設1:自變量和因變量均為二分類變量。
2. 假設2:觀測間相互獨立。
接下來,將介紹計算比值比的SPSS操作。
三、SPSS操作
1. 數據准備
如果研究者使用原始數據,跳過數據准備步驟,直接計算比值比;如果使用按性別和喜歡競技類運動與否統計的匯總數據,則需要添加權重,步驟如下。
(1)點擊主菜單Data > Weight Cases,如下圖:

點擊后出現Weight Cases對話框,如下圖:

(2)勾選Weight cases by選項,激活 鍵和Frequency Variable: 框,如下圖:

(3)將變量freq選入Frequency Variable框,如下圖:

(4)點擊OK鍵,為數據加權。
2. 比值比的SPSS操作
(1)點擊主菜單Analyze > Descriptive Statistics > Crosstabs,如下圖:

點擊后出現Crosstabs對話框,如下圖:

注意:如果使用頻數統計的數據文件,Crosstabs對話框如下圖:

(2)將自變量gender選入Row(s):框,因變量comp選入Column(s):框,如下圖:

注意:如果使用頻數統計的數據文件,Crosstabs對話框如下圖:

(3)點擊Statistics鍵,出現Crosstabs Statistics對話框,如下圖:

(4)勾選Risk,如下圖:

(5)點擊Continue鍵。
(6)點擊OK鍵,生成結果。
四、結果解釋
1. 描述性分析
在報告比值比前,研究者應該先查看基本的一些統計量,了解數據特征。本例查看gender*comp Crosstabulation表,如下圖:

表中可看到50名研究對象中男性和女性各25人。首先,查看男性喜歡競技類運動的比值,如下圖高亮顯示:

25名男性中,18名男性喜歡競技類運動,7名不喜歡(即喜歡娛樂性運動)。因此,男性喜歡競技類運動的比值為喜歡與不喜歡的概率之比,即為喜歡競技類運動的男性數量除以不喜歡的男性數量,得到比值為2.57(18÷7=2.57)。因此對男性來講,喜歡競技類運動的概率是喜歡娛樂性運動概率的兩倍多。
同理,也可以得到女性的比值。下表中為25名女性喜歡競技類運動的情況:

25名女性中10名喜歡競技類運動,15名不喜歡。因此女性喜歡競技類運動的比值為為喜歡競技類運動的女性數量除以不喜歡的女性數量,得到比值為0.67(10÷15=0.67)。因此對女性來講,喜歡競技類運動的概率是喜歡娛樂性運動概率的0.67倍。
因此,研究者可以匯報:“本研究招募了50名研究對象,男女性各25人。與娛樂性運動(n=7)相比,男性更喜歡競技類運動(n=18);在女性中則相反,10名女性喜歡競技類運動、15名女性喜歡娛樂性運動”。
2. 比值比
觀察Risk Estimate表可以得到比值比,如下圖:

性別與喜歡競技類運動與否的比值比為3.857,95%置信區間為1.180到12.606。95%置信區間代表研究者有95%的把握確定人群中這一關聯的真實比值比在1.180到12.606之間。此外,比值比還可以通過gender*comp Cross tabulation表的兩個比值手動算出。
計算性別與喜歡競技類運動與否的比值比,僅需要用男性的比值除以女性的比值,如下面算式。因此,男性喜歡競技類運動的可能性是女性3.857倍。

如果比值比大於1且95%置信區間不包括1,代表男性喜歡競技類運動的可能性大於女性;反之,比值比小於1且95%置信區間不包括1,則代表男性喜歡競技類運動的可能性小於女性;若比值比的95%置信區間包括1,則說明男女性喜歡競技類運動的可能性無統計學差異。
五、撰寫結論
本研究招募了50名研究對象,男女性各25人。與娛樂性運動(n=7)相比,男性更喜歡競技類運動(n=18);在女性中則相反,10名女性喜歡競技類運動、15名女性喜歡娛樂性運動。與女性相比,男性喜歡競技類運動的比值比是3.857(95%置信區間:1.180-12.606),且有統計學意義。
