K均值聚類是基於原型的、划分的聚類方法。聚類數K由用戶指定,初始的K個聚類中心隨機選取,然后將每個點分派到最近的聚類中心,形成K個簇,接下來重新計算每個簇的聚類中心,重復上一步,直到簇不發生變化或達到最大迭代次數為止。距離度量有歐氏距離、曼哈頓距離、切比雪夫距離、余弦距離等。歐式距離容易受指標不同單位刻度的影響,值越大,個體間差異越大;而余弦距離不受指標刻度的影響,值越大,差異越小。
簇的最小化誤差平方和或最大化余弦相似度和的最佳聚類中心是簇中各點的均值。
單連接距離:一個類的所有成員到另一個類的所有成員之間的最短最短兩點之間的距離;
全連接距離:兩個類中最遠的兩個點之間的距離;
平均連接距離:兩個類中的點兩兩的距離求平均;
K-Means簡單易於實現,但K值需要預先給定,對初始聚類中心比較敏感,在大規模數據時收斂慢。改進版二分K-Means、K-Means++和批處理K-Means。
與FCM的區別:K-Means屬於硬聚類,FCM屬於軟聚類;K-Means計算的值非0即1,FCM通過賦予隸屬度權重,計算概率(百分比)來判斷當前數據哪一個cluster。

<script>
(function(){
function setArticleH(btnReadmore,posi){
var winH = $(window).height();
var articleBox = $("div.article_content");
var artH = articleBox.height();
if(artH > winH*posi){
articleBox.css({
'height':winH*posi+'px',
'overflow':'hidden'
})
btnReadmore.click(function(){
articleBox.removeAttr("style");
$(this).parent().remove();
})
}else{
btnReadmore.parent().remove();
}
}
var btnReadmore = $("#btn-readmore");
if(btnReadmore.length>0){
if(currentUserName){
setArticleH(btnReadmore,3);
}else{
setArticleH(btnReadmore,1.2);
}
}
})()
</script>
</article>
