fuzzy c-means

本文轉載自查看原文 2013-03-06 16:21 3644 算法

　　在k-means中，每個元素只能屬於所有類別中的一類。那這樣會帶來一些問題：

所有的元素對於計算聚類中心的貢獻都是相同的。

　　因為從根本上，對於屬於一個類的所有元素來說，在k-means中是無法將他們區別開的（如果非要用距離什么的來區分也可以，但是這部分功能不是k-mean擅長的）。而在fuzzy c-means中，元素可能屬於任何一類，不同的是它們之間的可能性是不同的。數學表示如下：

J_m = ΣΣu_ij^m × |x_i - c_i|²

其中：

x_i：元素；
c_j：聚類中心；
u_ij：元素x_i對於聚類中心c_j的隸屬度（屬於這個類的可能性）；
m：大於1的實數，一般取值2.0；

　　J_m用來評估聚類效果，J_m越大，聚類效果越差。那么聚類的過程其實就是找J_m的極小值的過程。其實從函數的角度看，Jm取得極小值時偏導數為0，也就是說u_ij和c_j的變換都接近於0，而這里其實我們只需要考慮一個（比如在u_ij趨於不變時通常c_j也趨於穩定），而這里選擇u_ij的原因是衡量起來簡單一點（取值范圍為[0,1]，設置一個比較小的閥值即可）。

求極值是一個迭代的過程，更新聚類中心c_j的方法與k-means非常相似，如下：

　　c_j = (Σu_ij^m × x_i) / Σu_ij^m

更新隸屬度u_ij的方法如下：

　　u_ij = 1 / (∑((|x_i - c_j|/|x_i - c_k|)^{2 / (m - 1)}))

那么迭代結束的條件顯然是：

　　max{|u_ij^k+1 - u_ij^k|} < ε

這樣，fuzzy c-means的整體的過程如下：

初始化隸屬度矩陣；
計算聚類中心C；
更新隸屬度矩陣U；
如果max{|u_ij^k+1 - u_ij^k|} < ε或者迭代次數達到上限，結束迭代，否則轉2；

注：不管是k-means還是fuzzy c-means，有沒有感覺這個過程和迭代法求線性方程組的解的過程非常相似？其實有時候感覺這兩個過程本來就是相同的。

fuzzy c-means迭代式的推導

利用拉格朗日乘子法構造新的函數：

　　J_m = ΣΣu_ij^m × |x_i - c_i|² + λ × (Σu_ij - 1)

在J_m取得極值時滿足如下條件：

∂J / ∂λ = Σu_ij - 1 = 0

∂J / ∂u_ij = m × u_ij^m-1 × |x_i - c_j|² - λ = 0

∂J / ∂c_j = Σu_ij^m × x_i - c_j × Σu_ij^m = 0

根據后面的兩條即可得到u_ij和c_j的迭代式（想想在第二條中如何消掉λ？提示：利用∑u_ij = 1）。

----- -- -

end

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python fuzzy c-means demo 聚類（三）FUZZY C-MEANS 模糊c-均值聚類算法——本質和邏輯回歸類似啊機器學習筆記----Fuzzy c-means(FCM)模糊聚類詳解及matlab實現 R中K-Means、Clara、C-Means三種聚類的評估 Fuzzy C Means 算法及其 Python 實現——寫得很清楚，見原文 K-means聚類算法原理和C++實現 js 模糊查詢（fuzzy search） C#下實現的基礎K-MEANS多維聚類 k-means聚類算法C++實現 Fuzzy模糊推導(Matlab實現)