K-means聚類分析

本文轉載自查看原文 2020-05-27 20:34 2018 機器學習

一、原理

選擇K個點做為初始的中心點
while（1）
{
      將所有點分配個K個中心點形成K個簇
      重新計算每個簇的中心點
      if（簇的中心點不再改變）
break；
}

　　– μk 表示簇Ck 的中心點（或其它能代表Ck的點）

　　– 若xn被划分到簇Ck則rnk=1，否則rnk= 0

• 目標：找到簇的中心點μk及簇的划分rnk使得目標函數SSE最小

不同的中心點會對聚類結果產生不同的影響：

1、

2、

此時你一定會有疑問：如何選取"較好的"初始中心點？

　　　　結論：若對數據不夠了解，可以直接選擇2和4方法

　　　Q：如何選取K

　　SSE一般隨着K的增大而減小

A：emmm你多嘗試幾次吧，看看哪個合適。斜率改變最大的點比如k=2

總結：

簡單的來說，K-means就是假設有K個簇，然后通過上面找初始點的方法，找到K個初始點，將所有的數據分為K個簇，然后一直迭代，在所有的簇里面找到找到簇的中心點μk及簇的划分rnk使得目標函數SSE最小或者中心點不變之后，迭代完成。成功把數據分為K類。

預告：下一篇博文講K-means代碼實現

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 k-means聚類分析聚類分析一、K-Means 用K-Means聚類分析做客戶分群 Python K-Means廣告效果聚類分析數學模型：3.非監督學習--聚類分析和K-means聚類小白學數據分析----->聚類分析理論之K-means理論篇 Spss K-means聚類分析案例——某移動公司客戶細分模型 Python機器學習(4)——基於k-means和tfidf的文本聚類分析 k-means聚類算法實例分析 K-means聚類算法