K-means聚類算法

本文轉載自查看原文 2021-11-02 09:47 425 推薦算法

一、思想

聚類：人以群分、物以類聚，使得簇內的距離接近，簇間距離遠。

可以做推薦冷啟動，區域推薦熱榜、用戶畫像

如何排除初始值落在異常值的影響：

可以把數據分為K堆，對每一堆都排序，去掉最小的和最大的25%，取中間的50%的數據取均值作為初始的聚類中心

優點：
1）原理比較簡單，實現也是很容易，收斂速度快。
2）聚類效果較優。
3）算法的可解釋度比較強。
4）主要需要調參的參數僅僅是簇數k

缺點：
1）K值的選取不好把握
2）對於不是凸的數據集比較難收斂
3）如果各隱含類別的數據不平衡，比如各隱含類別的數據量嚴重失衡，或者各隱含類別的方差不同，則聚類效果不佳。
4）采用迭代方法，得到的結果只是局部最優。
5）對噪音和異常點比較的敏感

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 K-Means 聚類算法 K-means聚類算法 K-Means聚類算法 K-means聚類算法聚類算法：K-Means 聚類算法——K-means（上） K-means聚類算法 K-means聚類算法聚類算法(K-means聚類算法) K-means聚類算法與EM算法