初步接觸數據集,探索性分析后,經常需要做一個相關分析,得到各變量間的相關系數以及顯著性水平。
本文介紹一下R-corrplot包進行相關可視化展示。
一 數據准備
載入所需的R包,利用公共數據集mtcars進行展示。
library(corrplot)
head(mtcars)
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
#計算變量之間的相關系數
corr <- cor(mtcars)
二 相關系數展示
2.1 默認參數展示
corrplot(corr)
2.2 更該形狀和顯示范圍
method,:指定形狀,可以是circle圓形(默認),square方形, ellipse, 橢圓形,number數值,shade陰影,color顏色,pie餅圖。
type:指定顯示范圍,full完全(默認),lower下三角,upper上三角。
corrplot(mat_cor, method = "number", type = "upper", title = "")
corrplot(mat_cor, method = "pie", type = "lower", title = "下三角",mar = c(1,1,1,1))
2.3 更改顏色
可以使用自定義顏色或者brewer.pal函數的畫板。
corrplot(corr, method = "ellipse", col = colorRampPalette(c("red", "blue"))(10), title = "更改顏色")
corrplot(corr, method = "number", col = RColorBrewer::brewer.pal(n=11, name = "RdYlGn"),title = "")
2.4 排序和聚類
order,:指定相關系數排序的方法, original原始順序,AOE特征向量角序,FPC第一主成分順序,hclust層次聚類順序,alphabet字母順序。
hclust.method:order參數為hclust時可指定hclust中方法,7種可選:complete, ward, single, average, mcquitty, median和centroid。
addrect:指定order參數為hclust時有效, 是否添加矩形框, 默認不添加, 用整數指定即可添加。
corrplot(corr,method="color",order="hclust",title = "hclust聚類", diag = TRUE,hclust.method="average",addCoef.col = "blue")
2.5 組合展示
corrplot(corr, method = "circle", type = "upper", tl.pos = "d")
corrplot(corr, add = TRUE, type = "lower", method = "number", diag = FALSE, tl.pos = "n", cl.pos = "n")
NOW,corrplot進行相關性的可視化就簡單介紹到這,可以根據自己的審美組合圖形,顏色等。
更多關於生信,R,Python的內容請掃碼關注小號,謝謝。