分析
算法 | 定義 | 優點 | 缺點 |
Kmeans | 簡單、高效、快速收斂、當簇接近高斯分布式,聚類效果好 | 必須定義平均值,K事先給定,K的值影響聚類效果,對異常值影響大 | |
DBSCAN | 可以對任意形狀進行聚類,對異常值不敏感 | 對簇密度相差較大,不均勻的話,聚類效果不好,樣本大,收斂時間長 | |
凝聚式層次聚類 | 速度快,對異常值影響不大,使用內存小 | 對高斯簇聚類效果不好 | |
EM算法 | |||
基於圖 | 使用降維技術,適合高維空間。對聚類類別少准確率高。 | 對參數敏感,不適合簇里面的樣本點少 |
如何在sklearn調用
算法名稱 | 函數 |
---|---|
K均值聚類算法 | from sklearn.cluster import KMeans |
小批量K均值算法 | from sklearn.cluster import MiniBatchKMeans |
BIRCH層次聚類 | ffrom sklearn.cluster import Birch |
.EM算法 | from sklearn.mixture import GaussianMixture |
DBSCAN算法 | from sklearn.cluster import DBSCAN |
OPTICS算法 | from sklearn.cluster import OPTICS |
Mean Shift算法 | from sklearn.cluster import MeanShift |
譜聚類算法 | from sklearn.cluster import SpectralClustering |
[refers](https://blog.csdn.net/weixin_41019798/article/details/103507875)