摘自:http://ramsey16.net/%E8%81%9A%E7%B1%BB%EF%BC%88%E4%B8%89%EF%BC%89fuzzy-c-means/
經典k-均值聚類算法的每一步迭代中,每一個樣本點都被認為是完全屬於某一類別。我們可以放松這個條件,假定每個樣本xjxj模糊“隸屬”於某一類的。
硬聚類把每個待識別的對象嚴格的划分某類中,具有非此即彼的性質;模糊聚類建立了樣本對類別的不確定描述,更能客觀的反應客觀世界,從而成為聚類分析的主流。
例1、一個一維的例子來說,給定一個特定數據集,分布如下圖:
圖中可以很容易分辨出兩類數據,分別表示為‘A’ and ‘B’. 利用前述的k-means 算法,每個數據關聯一個特定的質心,隸屬度函數如下所示:
用FCM 算法,同一個數據並不單獨屬於一個分類,而是可以出現在中間。在這個例子中,隸屬函數變得更加平滑,表明每個數據可能屬於幾個分類。
上圖中,紅色點表示的數據更可能屬於類別B,而不是A, ‘m’ 的值0.2表明了數據對A的隸屬程度。