最近一直在實現一篇注釋軌跡的文章,里面要用到kmeans聚類方法,先在網上隨便找了一個kmeans程序進行聚類,結果發現時間太長,最后問了作者,作者采用的是vlfeat的系列程序,里面的kmens++程序速度較一般的來說比較快,網址如下:
http://www.vlfeat.org/index.html
實驗中發現,如果聚類的特征都是從一個圖片上得來,或者說都是一類相像的圖片,每次的聚類結果是相同的,但是如果說聚類的圖片來自兩類圖片的話,,每次聚類的結果差異就比較大了。這是因為kmeans本身存在的缺陷:初始化的點每次都是隨機的,那么該如何解決這個問題呢?
問了幾個師兄,然后再查了一些資料,並沒有什么好的解決辦法,只能在反復訓練中找到最好的聚類結果,然后保存下來,后面都用這個結果,這樣也不是沒有道理,因為,這本來就是訓練集需要的數據,在實際或者實驗中,訓練集本身就是提前知道的,在訓練集不變的情況下就可以使用這種方法。
————————————————
版權聲明:本文為CSDN博主「Tavia_YingWa」的原創文章,遵循CC 4.0 BY-SA版權協議,轉載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/sinat_31407371/article/details/53837328