變異系數(Coefficient of Variation)
用法:
當需要比較兩組數據離散程度大小的時候,如果兩組數據的測量尺度相差太大,或者數據量綱的不同,直接使用標准差來進行比較不合適,此時就應當消除測量尺度和量綱的影響,而變異系數可以做到這一點,它是原始數據標准差與原始數據平均數的比。
計算公式:
為標准差與平均值之比
注意點:
1.一般來說,變量值平均水平高,其離散程度的測度值越大,反之越小
2.在進行數據統計分析時,如果變異系數大於15%,則要考慮該數據可能不正常,應該剔除,對於這段話,我保留意見
3.其數據大小不僅受變量值離散程度的影響,而且還受變量值平均水平大小的影響,也就是說均值比較小時,結果波動會特別大
優缺點:
優點:
比起標准差來,變異系數的好處是不需要參照數據的平均值。變異系數是一個無量綱量,因此在比較兩組量綱不同或均值不同的數據時,應該用變異系數而不是標准差來作為比較的參考。
缺陷:
1.當平均值接近於0的時候,微小的擾動也會對變異系數產生巨大影響,因此造成精確度不足。
2.變異系數無法發展出類似於均值的置信區間的工具。