原理
- 聚類、高維可視化、數據壓縮、特征提取
- 自組織映射神經網絡本質上是一個兩層的神經網絡,包含輸入層和輸出層(競爭層)輸出層中神經元的個數通常是聚類的個數
- 訓練時采用“競爭學習”方式,每個輸入在輸出層中找到一個和它最匹配的節點,稱為激活節點。緊接着用隨機梯度下降法更新激活節點的參數,同時,激活節點臨近的點也根據他們距離激活節點的遠近而適當地更新(更新方式為“墨西哥帽式”)。這種競爭可以通過神經元之間的橫向抑制連接(負反饋路徑)來實現。
- 輸出層節點是有拓撲關系的(一維線陣、二維平面陣、三維柵格陣),且具有保序映射的特點
- 學習過程:
- 初始化
- 競爭:找到激活節點
- 合作:更新臨界節點參數
- 適應:適當調整相關興奮神經元連接權重,使獲勝神經元對相似輸入模型的后續應用的響應增強
- 迭代:回到競爭
與K均值的區別
- 不需要確定類的個數,因為聚類結果的實際簇數可以小於神經元的個數
- K均值找到一個最相似的類后,只更新這個類參數;自組織映射神經網絡更新了臨近的節點。所以K均值易受噪聲的影響,而后者准確性可能更低一些
- 自組織映射神經網絡的可視化較好,具有優雅的拓撲關系圖