聚類——認識FCM算法
作者:凱魯嘎吉 - 博客園 http://www.cnblogs.com/kailugaji/
一、FCM概述
FCM算法是基於對目標函數的優化基礎上的一種數據聚類方法。聚類結果是每一個數據點對聚類中心的隸屬程度,該隸屬程度用一個數值來表示。該算法允許同一數據屬於多個不同的類。
FCM算法是一種無監督的模糊聚類方法,在算法實現過程中不需要人為的干預。
這種算法的不足之處:首先,算法中需要設定一些參數,若參數的初始化選取的不合適,可能影響聚類結果的正確性;其次,當數據樣本集合較大並且特征數目較多時,算法的實時性不太好。
K-means也叫硬C均值聚類(HCM),而FCM是模糊C均值聚類,它是HCM的延伸與拓展,HCM與FCM最大的區別在於隸屬函數(划分矩陣)的取值不同,HCM的隸屬函數只取兩個值:0和1,而FCM的隸屬函數可以取[0,1]之間的任何數。K-means和FCM都需要事先給定聚類的類別數,而FCM還需要選取恰當的加權指數α,α的選取對結果有一定的影響,α屬於[0,+∞)。