聚类算法优缺点分析


个人博客,欢迎来撩 fangzengye.com

分析

 

算法 定义 优点 缺点
Kmeans   简单、高效、快速收敛、当簇接近高斯分布式,聚类效果好 必须定义平均值,K事先给定,K的值影响聚类效果,对异常值影响大
DBSCAN   可以对任意形状进行聚类,对异常值不敏感 对簇密度相差较大,不均匀的话,聚类效果不好,样本大,收敛时间长
凝聚式层次聚类   速度快,对异常值影响不大,使用内存小 对高斯簇聚类效果不好
EM算法      
基于图   使用降维技术,适合高维空间。对聚类类别少准确率高。 对参数敏感,不适合簇里面的样本点少

如何在sklearn调用

 

算法名称 函数
K均值聚类算法 from sklearn.cluster import KMeans
小批量K均值算法 from sklearn.cluster import MiniBatchKMeans
BIRCH层次聚类 ffrom sklearn.cluster import Birch
.EM算法 from sklearn.mixture import GaussianMixture
DBSCAN算法 from sklearn.cluster import DBSCAN
OPTICS算法 from sklearn.cluster import OPTICS
Mean Shift算法 from sklearn.cluster import MeanShift
谱聚类算法 from sklearn.cluster import SpectralClustering

 

[refers](https://blog.csdn.net/weixin_41019798/article/details/103507875)

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM