相關分析(二元定距變量的相關分析、二元定序變量的相關分析、偏相關分析和距離相關分析)
定義:衡量事物之間,或稱變量之間線性關系相關程度的強弱並用適當的統計指標表示出來,這個過程就是相關分析
變量之間的關系歸納起來可以分為兩種類型,即函數關系和統計關系。
相關分析的方法較多,比較直接和常用的一 種是繪制散點圖。圖形雖然能夠直觀展現變量之間的相關關系,但不很精確。為了能夠更加准確地描述變量之間的線性相關程度,可以通過計算相關系數來進行相關分析
總體相關系數,記為 ρ;樣本相關系數,記為 r。統計學中,一般用樣本相關系數 r 來推斷總體相關系數
相關系數的取值范圍在1和+1之間,即1≤r≤+1
若0<r≤1,表明變量之間存在正相關關系,即兩個變量的相隨變動方向相同;
若-1≤r<0,表明變量之間存在負相關關系,即兩個變量的相隨變動方向相反;
當|r| =1時,其中一個變量的取值完全取決於另一個變量,兩者即為函數關系;若 r= +1,表明變量之間完全正相關;若 r= -1,表明變量之間完全負相關。
當r= 0時,說明變量之間不存在線性相關關系,但這並不排除變量之間存在其他非線性關系的可能。
根據經驗可將相關程度分為以下幾種情況:
若r≥0.8 時,視為高度相關
若0.5≤r<0.8 時,視為中度相關
當0.3≤r<0.5 時,視為低度相關
當 r<0.3 時,說明變量之間的相關程度極弱,可視為不相關
二元變量的相關分析是指通過計算變量間兩兩相關的相關系數,對兩個或兩個以上變量之間兩兩相關的程度進行分析。
1.二元定距變量的相關分析
定義:通過計算定距變量間兩兩相關的相關系數,對兩個或兩個以上定距變量之間兩兩相關的程度進行分析。
定距變量:又稱為間隔(interval)變量,它的取值之間可以比較大小,可以用加減法計算出差異的大小。
Pearson簡單相關系數用來衡量定距變量間的線性關系
對Pearson簡單相關系數的統計檢驗是計算t統計量
SPSS操作
2.二元定序變量的相關分析
定序變量:又稱為有序(ordinal)變量、順序變量,它取值的大小能夠表示觀測對象的某種順序關系(等級、方位或大小等)
Spearman和Kendall's tua-b等級相關系數用以衡量定序變量間的線性相關關系,它們利用的是非參數檢驗的方法。
對Spearman和Kendall's tua-b等級相關系數的統計檢驗是計算Z統計量
SPSS操作
3.偏相關分析
定義:當兩個變量同時與第三個變量相關時,將第三個變量的影響剔除,只分析另外兩個變量之間相關程度的過程。
偏相關分析的工具是計算偏相關系數,統計檢驗為t檢驗
SPSS操作
4.距離相關分析
定義:對觀測量之間或變量之間相似或不相似的程度的一種測量。 距離相關分析可用於同一變量內部各個取值間,以考察其相互接近程度;也可用於變量間,以考察預測值對實際值的擬合優度。
分類:距離相關分析分為相似性測量和不相似性測量,也可分為樣本間分析和變量間分析。
在不相似性測量的距離分析中:
對連續變量的樣本 (x,y) 進行距離相關分析時,常用的統計量有:歐氏距離、 歐氏距離平方、 Chebychev距離 、 Block距離 、 Minkowski距離 、Customized 距離(用戶自定義距離)
對順序或名義變量的樣本 (x,y) 進行距離相關分析時,常用的統計量有:Chi-square measure (χ2統計量) 、 Phi-square measure (φ2 統計量)
對於二值變量,可以使用歐氏距離、歐氏距離平方、方差等方法進行計算
SPSS操作