library(package="car") data <- read.csv("C:\\users\\mike1\\desktop\\data\\RData\\hald水泥數據.csv", header=T, sep=",",fileEncoding = "utf-8", stringsAsFactors = FALSE) data1 <- data[2:dim(data)[2]] data1 cor(data1) scatterplotMatrix(data1, main="correlation") result <- lm(y~., data=data1) summary(result) vif(result) # we can directly use the function not like python class step(result,direction="forward") step(result,direction="backward") step(result, direction="both") myStep <- step(result, direction="both") myStep1 <- step(result,direction="backward",trace=2) summary(myStep) summary(myStep1)
vif(myStep)
共線性,顯示各變量之間有強相關,vif()函數在 car包中, 而step() 函數內置。
偏相關圖
相關系數圖:
逐步回歸圖
以上只截取了部分圖,但是結果與書上的不一樣。最后雖然使用的是逐步回歸,但是有一個系數不顯著,不知道為什么沒把 x4.1這個變量去掉,只能手動選擇x1, x2 作為變量。