分析
算法 | 定义 | 优点 | 缺点 |
Kmeans | 简单、高效、快速收敛、当簇接近高斯分布式,聚类效果好 | 必须定义平均值,K事先给定,K的值影响聚类效果,对异常值影响大 | |
DBSCAN | 可以对任意形状进行聚类,对异常值不敏感 | 对簇密度相差较大,不均匀的话,聚类效果不好,样本大,收敛时间长 | |
凝聚式层次聚类 | 速度快,对异常值影响不大,使用内存小 | 对高斯簇聚类效果不好 | |
EM算法 | |||
基于图 | 使用降维技术,适合高维空间。对聚类类别少准确率高。 | 对参数敏感,不适合簇里面的样本点少 |
如何在sklearn调用
算法名称 | 函数 |
---|---|
K均值聚类算法 | from sklearn.cluster import KMeans |
小批量K均值算法 | from sklearn.cluster import MiniBatchKMeans |
BIRCH层次聚类 | ffrom sklearn.cluster import Birch |
.EM算法 | from sklearn.mixture import GaussianMixture |
DBSCAN算法 | from sklearn.cluster import DBSCAN |
OPTICS算法 | from sklearn.cluster import OPTICS |
Mean Shift算法 | from sklearn.cluster import MeanShift |
谱聚类算法 | from sklearn.cluster import SpectralClustering |
[refers](https://blog.csdn.net/weixin_41019798/article/details/103507875)