衡量隨機變量相關性的方法主要有三種:pearson相關系數,spearman相關系數,kendall相關系數:
1. pearson相關系數,亦即皮爾遜相關系數
pearson相關系數用來衡量兩個隨機變量之間的相關性
R語言中求兩個隨機變量pearson相關系數的函數:
1//賦予a,b向量值
2a<-c(1,2,3)
3b<-c(11,12,14)
4
5//計算pearson相關系數
6cor.test(a,b,method="pearson")
結果
Pearson's product-moment correlation
data: a and b
t = 5.1962, df = 1, p-value = 0.121
alternative hypothesis: true correlation is not equal to 0
sample estimates:
cor
總結
P=0.121, cor=0.9819805
2. spearman相關系數,亦即秩相關系數
spearman和kendall都是等級相關系數,亦即其值與兩個相關變量的具體值無關,而僅僅與其值之間的大小關系有關。
spearman相關系數,亦即秩相關系數,根據隨機變量的等級而不是其原始值衡量相關性的一種方法。
spearman相關系數的計算可以由計算pearson系數的方法,只需要把原隨機變量中的原始數據替換成其在隨機變量中的等級順序即可:
(1,10,100,101)替換成(1,2,3,4)
(21,10,15,13)替換成(4,1,3,2)
然后求替換后的兩個隨機變量的pearson相關系數即可.
R語言中求兩個隨機變量的spearman相關系數的函數:
1 //賦予a,b向量值
2 a<-c(1,10,100,101)
3 b<-c(21,10,15,13)
4
5 //計算spearman相關系數
6 cor.test(a,b,method="spearman")
7 rho=-0.4
8
9 //用替換后的向量的pearson相關系數進行驗證
10 e<-c(1,2,3,4)
11 f<-c(4,1,3,2)
12 cor.test(e,f,method="pearson")
13 cor=-0.4
結果
Spearman's rank correlation rho
data: a and b
S = 14, p-value = 0.75
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
-0.4
總結 p=0.75,rho=0.4
3. kendall相關系數,亦即和諧系數
kendall相關系數又稱作和諧系數,也是一種等級相關系數
對於X,Y的兩對觀察值Xi,Yi和Xj,Yj,如果Xi並且Xj或者Xi>Yi並且Xj>Yj,則稱這兩對觀察值是和諧的,否則就是不和諧的.
R語言中計算kendall相關系數的函數:
1 //賦予a,b向量值
2 a<-c(1,2,3)
3 b<-c(1,3,2)
4
5 //計算kendall相關系數
6 cor.test(a,b,method="kendall")
7 tau=0.3333333333
結果
Kendall's rank correlation tau
data: a and b
T = 2, p-value = 1
alternative hypothesis: true tau is not equal to 0
sample estimates:
tau
0.3333333
總結:p=1,tau=0.3333333
來源:http://blog.sina.com.cn/s/blog_5d188bc40102vuvj.html
