聚类评价指标(Clustering Metrics)


-兰德系数(Rand Index)

a: 在C和K中都分为同类的样本对的数量;

b: 在C和K中都分为不同类的样本对的数量;

分母: 所有的样本对数量. 其中n为样本空间的大小.

$ \frac{a+b}{C_{n}^2}$

 

-正则化熵 (Normalized Entropy, NE)

  • NE等于预测的log loss除以background CTR的熵

 

-互信息 (Mutual Information, MI)

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM