1 K-means解釋
- k-means其實包含兩層內容:
- K : 初始中心點個數(計划聚類數)
- means:求中心點到其他數據點距離的平均值
2 k-means聚類步驟
- 1、隨機設置K個特征空間內的點作為初始的聚類中心
- 2、對於其他每個點計算到K個中心的距離,未知的點選擇最近的一個聚類中心點作為標記類別
- 3、接着對着標記的聚類中心之后,重新計算出每個聚類的新中心點(平均值)
- 4、如果計算得出的新中心點與原中心點一樣(質心不再移動),那么結束,否則重新進行第二步過程
k聚類動態效果圖
2 案例練習
1、隨機設置K個特征空間內的點作為初始的聚類中心(本案例中設置p1和p2)
2、對於其他每個點計算到K個中心的距離,未知的點選擇最近的一個聚類中心點作為標記類別
3、接着對着標記的聚類中心之后,重新計算出每個聚類的新中心點(平均值)
4、如果計算得出的新中心點與原中心點一樣(質心不再移動),那么結束,否則重新進行第二步過程【經過判斷,需要重復上述步驟,開始新一輪迭代】
5、當每次迭代結果不變時,認為算法收斂,聚類完成,K-Means一定會停下,不可能陷入一直選質心的過程。