一、解釋
變異系數(coefficient of variation)又稱離散系數,是一個衡量數據離散程度的、沒有量綱的統計量。
其值(CV
)為標准差與平均值之比。
變異系數取值一般為:[0, +無窮)
二、實現
import numpy as np
def coefficient_of_variation(data):
mean = np.mean(data) # 平均值
std = np.std(data, ddof=0) # 標准差 自由度
cv = std / mean
return cv
data_test1 = [1,2,3,4,5,6,7]
data_test2 = [1,1,1,4,7,7,7]
print("CV of data_test1:", coefficient_of_variation(data_test1))
print("CV of data_test2:", coefficient_of_variation(data_test2))
# CV of data_test1: 0.5
# CV of data_test2: 0.6943650748294136
三、實際應用
變異系數通常用來比較兩組量綱差異明顯的數據的離散程度。
例如:兩個粉絲數差距顯著的社交媒體賬號推文點贊數的離散程度。