R語言中scale函數。
scale(x, center = TRUE, scale = TRUE), 為數據對象x按列進行中心化(center = TRUE)或標准化(center=TRUE, scale = TRUE)。
scale函數是將一組數進行處理,默認情況下是將一組數的每個數都減去這組數的平均值后再除以這組數的均方根(其中均方根除數是n-1)。
數據中心化和標准化的意義是一樣的,為了消除量綱對數據結構的影響。
1、測試1
setwd("C:/Users/75377/Desktop/SHEEP_ROH") a <- c(3,1,2,6) b <- c(4,6,8,2) c <- data.frame(a,b) c d <- scale(c) d
驗證:
d up_a <- a - mean(a) ## a列元素每個元素與平均數只差 down_a <- sqrt(sum((a - mean(a))^2)/(length(a)-1)) ## 均方根 up_a/down_a up_b <- b - mean(b) ## b列 down_b <- sqrt(sum((b - mean(b))^2)/(length(b)-1)) up_b/down_b