R語言做相關性分析


衡量隨機變量相關性的方法主要有三種:pearson相關系數,spearman相關系數,kendall相關系數:

1.       pearson相關系數,亦即皮爾遜相關系數

pearson相關系數用來衡量兩個隨機變量之間的相關性

R語言中求兩個隨機變量pearson相關系數的函數:

1//賦予a,b向量值

2a<-c(1,2,3)

3b<-c(11,12,14)

4

5//計算pearson相關系數

6cor.test(a,b,method="pearson")

結果

Pearson's product-moment correlation

 

data:  a and b

t = 5.1962, df = 1, p-value = 0.121

alternative hypothesis: true correlation is not equal to 0

sample estimates:

      cor

0.9819805

總結

P=0.121, cor=0.9819805

2.       spearman相關系數,亦即秩相關系數

spearman和kendall都是等級相關系數,亦即其值與兩個相關變量的具體值無關,而僅僅與其值之間的大小關系有關。

spearman相關系數,亦即秩相關系數,根據隨機變量的等級而不是其原始值衡量相關性的一種方法。

spearman相關系數的計算可以由計算pearson系數的方法,只需要把原隨機變量中的原始數據替換成其在隨機變量中的等級順序即可:

(1,10,100,101)替換成(1,2,3,4)

(21,10,15,13)替換成(4,1,3,2)

然后求替換后的兩個隨機變量的pearson相關系數即可.

R語言中求兩個隨機變量的spearman相關系數的函數:

1 //賦予a,b向量值
a<-c(1,10,100,101)
3 b<-c(21,10,15,13)
4
 5 //計算spearman相關系數
6 cor.test(a,b,method="spearman")
7 rho=-0.4
8
 9 //用替換后的向量的pearson相關系數進行驗證
10 e<-c(1,2,3,4)
11 f<-c(4,1,3,2)
12 cor.test(e,f,method="pearson")
13 cor=-0.4

結果

Spearman's rank correlation rho

 

data:  a and b

S = 14, p-value = 0.75

alternative hypothesis: true rho is not equal to 0

sample estimates:

 rho

-0.4

總結 p=0.75,rho=0.4

 

3.       kendall相關系數,亦即和諧系數

kendall相關系數又稱作和諧系數,也是一種等級相關系數

對於X,Y的兩對觀察值Xi,Yi和Xj,Yj,如果Xi並且Xj或者Xi>Yi並且Xj>Yj,則稱這兩對觀察值是和諧的,否則就是不和諧的.

R語言中計算kendall相關系數的函數:

1 //賦予a,b向量值
a<-c(1,2,3)
3 b<-c(1,3,2)
4
5 //計算kendall相關系數
6 cor.test(a,b,method="kendall")
7 tau=0.3333333333
結果

Kendall's rank correlation tau

 

data:  a and b

T = 2, p-value = 1

alternative hypothesis: true tau is not equal to 0

sample estimates:

      tau

0.3333333

總結:p=1,tau=0.3333333

來源:http://blog.sina.com.cn/s/blog_5d188bc40102vuvj.html


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM