Lloyd’s 算法和 K-Means算法

本文轉載自查看原文 2018-10-27 11:45 733 機器學習

在講Lloyd’s 算法之前先介紹Voronoi圖

在數學中，Voronoi圖是基於到平面的特定子集中的點的距離將平面划分成區域。預先指定一組點（稱為種子，站點或生成器），並且對於每個種子，存在相應的區域，該區域由更接近該種子的所有點組成，而不是任何其他點。這些區域稱為Voronoi細胞。

在最簡單的情況下，如圖所示，我們在歐幾里德平面上給出了一組有限的點{p1，...，pn}。在這種情況下每個站點pk只是一個點，其相應的Voronoi單元Rk由歐幾里德平面中的每個點組成，其與pk的距離小於或等於其與任何其他pk的距離。每個這樣的單元是從半空間的交點獲得的，因此它是凸多邊形。 Voronoi圖的邊界是平面中與兩個最近的站點等距的所有點。 Voronoi頂點（節點）是與三個（或更多）站點等距的點。

Lloyd’s algorithm 過程：

（1）首先在數據集中隨機選定k個初始點

（2）計算k個站點的Voronoi圖。

（3）整合Voronoi圖的每個單元格，並計算質心。

（4）然后將每個站點（k）移動到其Voronoi單元的質心。

如下圖迭代過程