1 聚類算法的概念
- 一種典型的無監督學習算法,
- 主要用於將相似的樣本自動歸到一個類別中
- 計算樣本和樣本之間的相似性,一般使用歐式距離
- 聚類算法分類
- 粗聚類
- 細聚類
2 聚類算法與分類算法最大的區別
- 聚類算法是無監督的學習算法,而分類算法屬於監督的學習算法。
3 聚類算法在現實中的應用
-
用戶畫像,廣告推薦,Data Segmentation,搜索引擎的流量推薦,惡意流量識別
-
基於位置信息的商業推送,新聞聚類,篩選排序
-
圖像分割,降維,識別;離群點檢測;信用卡異常消費;發掘相同功能的基因片段