R繪圖 第十篇:繪制散點圖(高級)


散點圖用於描述兩個連續性變量間的關系,三個變量之間的關系可以通過3D圖形或氣泡來展示,多個變量之間的兩兩關系可以通過散點圖矩陣來展示。

一,添加了最佳擬合曲線的散點圖

使用基礎函數plot(x,y)來繪制散點圖,其中x和y是數值型向量,代表着圖形中的點(x,y)

attach(mtcars)
plot(wt,mpg,
     main='Basic Scatter plot of MPG vs Weight',
     xlab='Car Weight(1bs/1000)',
     ylab='Miles Per Gallon',
     pch=19)
abline(lm(mpg~wt),col='red',lwd=2,lty=1)
lines(lowess(wt,mpg),col='blue',lwd=2,lty=2)

abline()函數用於添加最佳擬合的線性回歸直線;lowess()函數用於添加一條平滑曲線。

car包中的scatterplot()函數增強了散點圖的許多功能,它可以很方便地繪制散點圖,並能添加擬合曲線,邊界箱線圖和置信橢圓,還可以按子集繪圖和交互式地識別點。

library(car)
scatterplot(mpg~wt|cyl, data=mtcars,lwd=2,span=0.75,
            main='Scatter Plot of MPG vs Weight by # Cylinders',
            xlab='Weight of Car (lbs/1000)',
            ylab='Miles Per Gallon',
            legend.plot=TRUE,
            boxplots='xy')

參數注釋:

formula: 在該參數中,分組使用 | group_variable 來表示。例如,mpg ~ wt| cyl,表示的含義是按照cyl的水平分別繪制mpg和wt的關系圖

span:控制loess曲線中的平滑量,該參數值最大,擬合的效果越好。

legend.plot:設置為TRUE,表示在左上邊界添加圖例

boxplots:表示邊界線箱圖,有效值是x,y或xy,分別表示在x軸,y軸,或xy軸上繪制箱圖。

二,散點圖矩陣

基礎函數paris()函數用於創建散點圖矩陣,panel.cor()函數是自定義的面板函數(panel function),用於在矩陣的上三角顯示相關度;下三角使用系統預定義的平滑函數,用於在矩陣的下三角顯示散點圖和平滑曲線。

panel.cor <- function(x, y, digits = 2, prefix = "", cex.cor, ...)
{
  usr <- par("usr")
  on.exit(par(usr))
  par(usr = c(0, 1, 0, 1))
  r <- abs(cor(x, y))
  txt <- format(c(r, 0.123456789), digits = digits)[1]
  txt <- paste0(prefix, txt)
  if(missing(cex.cor)) cex.cor <- 0.8/strwidth(txt)
  text(0.5, 0.5, txt, cex = cex.cor * r)
}

pairs(~mpg+disp+drat+wt,data=mtcars,
      lower.panel=panel.smooth,
      upper.panel=panel.cor)

car包中的scatterplotMatrix()函數,用於生成散點圖矩陣,實際上,該函數是pairs()的封裝器,用於產生增強的散點圖矩陣,spm是該函數的別名。

scatterplotMatrix(x, 
    diagonal=c("density", "boxplot", "histogram", "oned", "qqplot", "none"), adjust=1, nclass,
    plot.points=TRUE, smoother=loessLine, smoother.args=list(), smooth, span,
    spread = !by.groups, reg.line=lm,
    transform=FALSE, family=c("bcPower", "yjPower"),
    ellipse=FALSE, levels=c(.5, .95), robust=TRUE,
    groups=NULL, by.groups=FALSE, 
    use=c("complete.obs", "pairwise.complete.obs"),
    labels, id.method="mahal", id.n=0, id.cex=1, id.col=palette()[1], id.location="lr",
    col=if (n.groups == 1) palette()[3:1] else rep(palette(), length=n.groups),
    pch=1:n.groups, lwd=1, lty=1, 
    cex=par("cex"), cex.axis=par("cex.axis"), cex.labels=NULL, 
    cex.main=par("cex.main"), 
    legend.plot=length(levels(groups)) > 1, legend.pos=NULL, row1attop=TRUE, ...)

參數注釋:

  • diagonal:對角線面板顯示的內容,
  • adjust:用於密度估計的相對帶寬(relative bandwidth),傳遞給density()函數
  • nclass:直方圖的封箱的數量,傳遞給hist()函數
  • plot.points:是否在非對角線繪制點,默認值是TRUE
  • smoother:用於制定函數,用於繪制平滑曲線,默認值是gamLine()函數,其他有效值是:loessLine,quantregLine
  • smoother.args:傳遞給smoother函數的參數,是一個list類型,例如,smoother.args==list(lty=2) 表示設置平滑(loess)擬合曲線使用虛線,而不是實線
  • smooth,span:這兩個參數是為了向后兼容,如果該參數設置為TRUE(默認值),那么smooter設置為LoessLine,使用LoessLine()函數繪制平滑曲線。如果設置span,那么該參數會被添加到smoother.args中。
  • spread:是否添加用於展示分散度和對稱信息的直線,默認值是by.groups參數值取反。
  • reg.line:默認值是lm,用於制定繪制回歸直線的函數
  • ellipse:在非對角線繪制數據密度橢圓
  • groups:對數據分組
  • by.groups:如果設置為TRUE,那么回歸直線按照分組來擬合(fit)

例如:使用mtcars數據集來繪制散點圖:

library(car)
scatterplotMatrix(~mpg+disp+drat+wt,data=mtcars,
                  spread=FALSE,smoother.args=list(lty=2),
                  main='Scatter Plot Matrix via car Package')

主對角線上放置了核密度曲線和軸須:

三,高密度散點圖

基礎包中的smoothScatter()函數,可以利用核密度估計生成用顏色密度來表示點密度的散點圖。 

set.seed(1234)
n<-1000
c1 <- matrix(rnorm(n,mean=0,sd=1),ncol = 2)
c2 <- matrix(rnorm(n,mean=3,sd=5),ncol = 2)
mydata <- rbind(c1,c2)
mydata <- as.data.frame(mydata)
names(mydata) <- c('x','y')

with(mydata,smoothScatter(x,y,main='Scatter Plot Colored by Smoothed Densities'))

hexbin包中hexbin()函數,把二元變量的封箱放到六邊形單元格中,xbins是水平封箱的數量:

hexbin(x, y, xbins = 30)

該函數創建了一個hexbin對象,最基本的組成是一個cell和落入每個cell的點的數量count。

例如,使用hexbin()來繪制高密度散點圖,六邊形的顏色深度表示散點的密度。

library(hexbin)
with(mydata,
     {bin <- hexbin(x,y,xbins=50)
     plot(bin,main='Hex binning with 10000 Observations')})

四,三維散點圖

 三維散點圖用於對三個變量之間的交互關系進行可視化,包scatterplot3d包中的函數scatterplot3d(),可以用於繪制三維散點圖:

scatterplot3d(x, y=NULL, z=NULL, color=par("col"), pch=par("pch"),
    main=NULL, sub=NULL, xlim=NULL, ylim=NULL, zlim=NULL,
    xlab=NULL, ylab=NULL, zlab=NULL, scale.y=1, angle=40,
    axis=TRUE, tick.marks=TRUE, label.tick.marks=TRUE,
    x.ticklabs=NULL, y.ticklabs=NULL, z.ticklabs=NULL,
    y.margin.add=0, grid=TRUE, box=TRUE, lab=par("lab"),
    lab.z=mean(lab[1:2]), type="p", highlight.3d=FALSE,
    mar=c(5,3,4,3)+0.1, bg=par("bg"), col.axis=par("col.axis"),
    col.grid="grey", col.lab=par("col.lab"), 
    cex.symbols=par("cex"), cex.axis=0.8 * par("cex.axis"),
    cex.lab=par("cex.lab"), font.axis=par("font.axis"),
    font.lab=par("font.lab"), lty.axis=par("lty"),
    lty.grid=par("lty"), lty.hide=NULL, lty.hplot=par("lty"),
    log="", asp=NA, ...)

參數注釋:

  • x,y,z:圖形的三個坐標
  • color:點的顏色
  • main,sub:主標題和小標題
  • xlim,ylim,zlim:用於指定(min,max),用於限制坐標軸上點的范圍。
  • xlab,ylab,zlab:各個坐標軸的標簽
  • scale.y:y軸相對於x和z的標度
  • angle:x和y軸之間的角度
  • axis:是否繪制坐標軸
  • tick.marks, label.tick.marks, x.ticklabs, y.ticklabs, z.ticklabs:刻度,刻度值
  • type:用於指定點的類型,p是點,l是線,h是在x-y平面中的垂線
  • highlight.3d:當type = "p" 或 type = "h" 時,根據y坐標把點繪制成不同的顏色;其他情況下,使用color參數的值來繪制點的顏色。

例如,利用mtcars數據集,繪制wt,disp和mpg之間的三維散點圖:

library(scatterplot3d)
with(mtcars,
     scatterplot3d(wt,disp,mpg,
              pch=16,
              highlight.3d = TRUE,
              type='h',
              main='3D Scatter Plot with Vertical Lines'))

可旋轉的3D散點圖:

library(rgl)
with(mtcars,
     plot3d(wt,disp,mpg,col='red',size=5))

library(car)
with(mtcars,scatter3d(wt,disp,mpg))

五,氣泡圖

使用氣泡圖來展示三個變量之間的關系,先創建一個二維散點圖,然后用點的大小來代表第三個變量的值。

基礎包中的symbols()函數用於繪制氣泡圖:

symbols(x, y = NULL, circles=radius, squares, rectangles, stars, inches = TRUE, 
        fg = par("col"), bg = NA,
        xlab = NULL, ylab = NULL, main = NULL,
        xlim = NULL, ylim = NULL, ...)

參數注釋:

x,y,circles:circles用於指定氣泡的半徑

inches:比例因子,控制氣泡的大小(默認最大圓圈為1 inch)

 

參考文檔:

scatterplotMatrix


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM