變異系數:變異系數(Coefficient of Variation):當需要比較兩組數據離散程度大小的時候,如果兩組數據的測量尺度相差太大(比如cm, km),或者數據量綱(比如重量,長度)的不同,直接使用標准差來進行比較不合適,此時就應當消除測量尺度和量綱的影響,而變異系數可以做到這一點,它是原始數據標准差與原始數據平均數的比。(百度百科)
變異系數:它是原始數據標准差與原始數據平均數的比。
1、測試數據
a、b分別用厘米、毫米度量同一組數據
a <- c(1, 2, 3, 5, 10) b <- c(10, 20, 30, 50, 100)
查看標准差:
sd_a <- sd(a) sd_b <- sd(b) sd_a sd_b
## b的離散程度更高嗎?
計算變異系數:
cv_a <- sd(a)/mean(a) cv_b <- sd(b)/mean(b) cv_a cv_b
因此, 比較兩組數據(測量尺度不同)的波動程度, 變異系數更合適。