聚類算法優缺點分析


個人博客,歡迎來撩 fangzengye.com

分析

 

算法 定義 優點 缺點
Kmeans   簡單、高效、快速收斂、當簇接近高斯分布式,聚類效果好 必須定義平均值,K事先給定,K的值影響聚類效果,對異常值影響大
DBSCAN   可以對任意形狀進行聚類,對異常值不敏感 對簇密度相差較大,不均勻的話,聚類效果不好,樣本大,收斂時間長
凝聚式層次聚類   速度快,對異常值影響不大,使用內存小 對高斯簇聚類效果不好
EM算法      
基於圖   使用降維技術,適合高維空間。對聚類類別少准確率高。 對參數敏感,不適合簇里面的樣本點少

如何在sklearn調用

 

算法名稱 函數
K均值聚類算法 from sklearn.cluster import KMeans
小批量K均值算法 from sklearn.cluster import MiniBatchKMeans
BIRCH層次聚類 ffrom sklearn.cluster import Birch
.EM算法 from sklearn.mixture import GaussianMixture
DBSCAN算法 from sklearn.cluster import DBSCAN
OPTICS算法 from sklearn.cluster import OPTICS
Mean Shift算法 from sklearn.cluster import MeanShift
譜聚類算法 from sklearn.cluster import SpectralClustering

 

[refers](https://blog.csdn.net/weixin_41019798/article/details/103507875)

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM