散點圖用於描述兩個連續性變量間的關系,三個變量之間的關系可以通過3D圖形或氣泡來展示,多個變量之間的兩兩關系可以通過散點圖矩陣來展示。
一,添加了最佳擬合曲線的散點圖
使用基礎函數plot(x,y)來繪制散點圖,其中x和y是數值型向量,代表着圖形中的點(x,y)
attach(mtcars) plot(wt,mpg, main='Basic Scatter plot of MPG vs Weight', xlab='Car Weight(1bs/1000)', ylab='Miles Per Gallon', pch=19) abline(lm(mpg~wt),col='red',lwd=2,lty=1) lines(lowess(wt,mpg),col='blue',lwd=2,lty=2)
abline()函數用於添加最佳擬合的線性回歸直線;lowess()函數用於添加一條平滑曲線。
car包中的scatterplot()函數增強了散點圖的許多功能,它可以很方便地繪制散點圖,並能添加擬合曲線,邊界箱線圖和置信橢圓,還可以按子集繪圖和交互式地識別點。
library(car) scatterplot(mpg~wt|cyl, data=mtcars,lwd=2,span=0.75, main='Scatter Plot of MPG vs Weight by # Cylinders', xlab='Weight of Car (lbs/1000)', ylab='Miles Per Gallon', legend.plot=TRUE, boxplots='xy')
參數注釋:
formula: 在該參數中,分組使用 | group_variable 來表示。例如,mpg ~ wt| cyl,表示的含義是按照cyl的水平分別繪制mpg和wt的關系圖
span:控制loess曲線中的平滑量,該參數值最大,擬合的效果越好。
legend.plot:設置為TRUE,表示在左上邊界添加圖例
boxplots:表示邊界線箱圖,有效值是x,y或xy,分別表示在x軸,y軸,或xy軸上繪制箱圖。
二,散點圖矩陣
基礎函數paris()函數用於創建散點圖矩陣,panel.cor()函數是自定義的面板函數(panel function),用於在矩陣的上三角顯示相關度;下三角使用系統預定義的平滑函數,用於在矩陣的下三角顯示散點圖和平滑曲線。
panel.cor <- function(x, y, digits = 2, prefix = "", cex.cor, ...) { usr <- par("usr") on.exit(par(usr)) par(usr = c(0, 1, 0, 1)) r <- abs(cor(x, y)) txt <- format(c(r, 0.123456789), digits = digits)[1] txt <- paste0(prefix, txt) if(missing(cex.cor)) cex.cor <- 0.8/strwidth(txt) text(0.5, 0.5, txt, cex = cex.cor * r) } pairs(~mpg+disp+drat+wt,data=mtcars, lower.panel=panel.smooth, upper.panel=panel.cor)
car包中的scatterplotMatrix()函數,用於生成散點圖矩陣,實際上,該函數是pairs()的封裝器,用於產生增強的散點圖矩陣,spm是該函數的別名。
scatterplotMatrix(x, diagonal=c("density", "boxplot", "histogram", "oned", "qqplot", "none"), adjust=1, nclass, plot.points=TRUE, smoother=loessLine, smoother.args=list(), smooth, span, spread = !by.groups, reg.line=lm, transform=FALSE, family=c("bcPower", "yjPower"), ellipse=FALSE, levels=c(.5, .95), robust=TRUE, groups=NULL, by.groups=FALSE, use=c("complete.obs", "pairwise.complete.obs"), labels, id.method="mahal", id.n=0, id.cex=1, id.col=palette()[1], id.location="lr", col=if (n.groups == 1) palette()[3:1] else rep(palette(), length=n.groups), pch=1:n.groups, lwd=1, lty=1, cex=par("cex"), cex.axis=par("cex.axis"), cex.labels=NULL, cex.main=par("cex.main"), legend.plot=length(levels(groups)) > 1, legend.pos=NULL, row1attop=TRUE, ...)
參數注釋:
- diagonal:對角線面板顯示的內容,
- adjust:用於密度估計的相對帶寬(relative bandwidth),傳遞給density()函數
- nclass:直方圖的封箱的數量,傳遞給hist()函數
- plot.points:是否在非對角線繪制點,默認值是TRUE
- smoother:用於制定函數,用於繪制平滑曲線,默認值是gamLine()函數,其他有效值是:loessLine,quantregLine
- smoother.args:傳遞給smoother函數的參數,是一個list類型,例如,smoother.args==list(lty=2) 表示設置平滑(loess)擬合曲線使用虛線,而不是實線
- smooth,span:這兩個參數是為了向后兼容,如果該參數設置為TRUE(默認值),那么smooter設置為LoessLine,使用LoessLine()函數繪制平滑曲線。如果設置span,那么該參數會被添加到smoother.args中。
- spread:是否添加用於展示分散度和對稱信息的直線,默認值是by.groups參數值取反。
- reg.line:默認值是lm,用於制定繪制回歸直線的函數
- ellipse:在非對角線繪制數據密度橢圓
- groups:對數據分組
- by.groups:如果設置為TRUE,那么回歸直線按照分組來擬合(fit)
例如:使用mtcars數據集來繪制散點圖:
library(car) scatterplotMatrix(~mpg+disp+drat+wt,data=mtcars, spread=FALSE,smoother.args=list(lty=2), main='Scatter Plot Matrix via car Package')
主對角線上放置了核密度曲線和軸須:
三,高密度散點圖
基礎包中的smoothScatter()函數,可以利用核密度估計生成用顏色密度來表示點密度的散點圖。
set.seed(1234) n<-1000 c1 <- matrix(rnorm(n,mean=0,sd=1),ncol = 2) c2 <- matrix(rnorm(n,mean=3,sd=5),ncol = 2) mydata <- rbind(c1,c2) mydata <- as.data.frame(mydata) names(mydata) <- c('x','y') with(mydata,smoothScatter(x,y,main='Scatter Plot Colored by Smoothed Densities'))
hexbin包中hexbin()函數,把二元變量的封箱放到六邊形單元格中,xbins是水平封箱的數量:
hexbin(x, y, xbins = 30)
該函數創建了一個hexbin對象,最基本的組成是一個cell和落入每個cell的點的數量count。
例如,使用hexbin()來繪制高密度散點圖,六邊形的顏色深度表示散點的密度。
library(hexbin) with(mydata, {bin <- hexbin(x,y,xbins=50) plot(bin,main='Hex binning with 10000 Observations')})
四,三維散點圖
三維散點圖用於對三個變量之間的交互關系進行可視化,包scatterplot3d包中的函數scatterplot3d(),可以用於繪制三維散點圖:
scatterplot3d(x, y=NULL, z=NULL, color=par("col"), pch=par("pch"), main=NULL, sub=NULL, xlim=NULL, ylim=NULL, zlim=NULL, xlab=NULL, ylab=NULL, zlab=NULL, scale.y=1, angle=40, axis=TRUE, tick.marks=TRUE, label.tick.marks=TRUE, x.ticklabs=NULL, y.ticklabs=NULL, z.ticklabs=NULL, y.margin.add=0, grid=TRUE, box=TRUE, lab=par("lab"), lab.z=mean(lab[1:2]), type="p", highlight.3d=FALSE, mar=c(5,3,4,3)+0.1, bg=par("bg"), col.axis=par("col.axis"), col.grid="grey", col.lab=par("col.lab"), cex.symbols=par("cex"), cex.axis=0.8 * par("cex.axis"), cex.lab=par("cex.lab"), font.axis=par("font.axis"), font.lab=par("font.lab"), lty.axis=par("lty"), lty.grid=par("lty"), lty.hide=NULL, lty.hplot=par("lty"), log="", asp=NA, ...)
參數注釋:
- x,y,z:圖形的三個坐標
- color:點的顏色
- main,sub:主標題和小標題
- xlim,ylim,zlim:用於指定(min,max),用於限制坐標軸上點的范圍。
- xlab,ylab,zlab:各個坐標軸的標簽
- scale.y:y軸相對於x和z的標度
- angle:x和y軸之間的角度
- axis:是否繪制坐標軸
- tick.marks, label.tick.marks, x.ticklabs, y.ticklabs, z.ticklabs:刻度,刻度值
- type:用於指定點的類型,p是點,l是線,h是在x-y平面中的垂線
- highlight.3d:當type = "p" 或 type = "h" 時,根據y坐標把點繪制成不同的顏色;其他情況下,使用color參數的值來繪制點的顏色。
例如,利用mtcars數據集,繪制wt,disp和mpg之間的三維散點圖:
library(scatterplot3d) with(mtcars, scatterplot3d(wt,disp,mpg, pch=16, highlight.3d = TRUE, type='h', main='3D Scatter Plot with Vertical Lines'))
可旋轉的3D散點圖:
library(rgl) with(mtcars, plot3d(wt,disp,mpg,col='red',size=5)) library(car) with(mtcars,scatter3d(wt,disp,mpg))
五,氣泡圖
使用氣泡圖來展示三個變量之間的關系,先創建一個二維散點圖,然后用點的大小來代表第三個變量的值。
基礎包中的symbols()函數用於繪制氣泡圖:
symbols(x, y = NULL, circles=radius, squares, rectangles, stars, inches = TRUE, fg = par("col"), bg = NA, xlab = NULL, ylab = NULL, main = NULL, xlim = NULL, ylim = NULL, ...)
參數注釋:
x,y,circles:circles用於指定氣泡的半徑
inches:比例因子,控制氣泡的大小(默認最大圓圈為1 inch)
參考文檔: