轉自:http://sofasofa.io/forum_main_post.php?postid=1000539
1.概念
硬聚類就是把數據確切地分到某一類中,比如K-Means。
硬就是說“強硬”,是屬於A類就是A類,不會跑到B類。
軟聚類就是把數據以一定的概率分到各類中,比如高斯混合模型(GMM),比如模糊C均值模型(Fuzzy c-Means)。聚類的結果往往是樣本1在A類的概率是0.7,在B類的概率是0.3。
軟聚類又稱為模糊聚類(fuzzy clustering)。
"軟聚類" (soft clustering) 算法,允許每個樣本以不同程度(不同概率)同時屬於多個原型。