Kmeans算法

本文轉載自查看原文 2019-09-08 10:48 447

1.Kmeans算法

1.1算法思想

kmeans算法又名k均值算法，是一個重復移動類中心點的過程，把類的中心點，也稱重心(centroids)，移動到其包含成員的平均位置，然后重新划分其內部成員。k是算法計算出的超參數，表示類的數量；Kmeans可以自動分配樣本到不同的類，但是不能決定究竟要分幾個類。k必須是一個比訓練集樣本數小的正整數。有時，類的數量是由問題內容指定的。其算法思想總結為：先從樣本集中隨機選取

1.原理比較簡單，實現也是很容易，收斂速度快。

2.對大數據集有較高的效率並且是可伸縮性的。

3.主要需要調參的參數僅僅是簇數k。

1.4.2缺點：

1.K值需要預先給定，很多情況下K值的估計是非常困難的。

2.K-Means算法對初始選取的質心點是敏感的，不同的隨機種子點得到的聚類結果完全不同，對結果影響很大。

3.采用迭代方法，可能只能得到局部的最優解，而無法得到全局的最優解。

參考文獻：

http://bigdata.51cto.com/art/201804/571439.htm

https://www.cnblogs.com/lliuye/p/9144312.html

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python Kmeans算法解析 python Kmeans算法 scala實現kmeans算法 Spark MLlib KMeans 聚類算法 kmeans均值聚類算法實現 kmeans算法思想及其python實現 Kmeans聚類算法的Sklearn實現 Kmeans算法的經典優化——mini-batch和Kmeans++ KMeans python3實現Kmeans++算法