机器学习——Mini Batch K-Means算法


  Mini Batch K-Means算法是K-Means算法的一种优化变种,采用小规模的数据子集(每次训练使用的数据集是在训练算法的时候随机抽取的数据子集)减少计算时间,同时试图优化目标函数; Mini Batch K-Means算法可以减少K- Means算法的收敛时间,而且产生的结果效果只是略差于标准K-Means算法

算法步骤如下:
  ●首先抽取部分数据集,使用K-Means算法构建出K个聚簇点的模型
  ●继续抽取训|练数据集中的部分数据集样本数据,并将其添加到模型中,分配给距离最近的聚簇中心点
  ●更新聚簇的中心点值(每次更新都只用抽取出来的部分数据集)
  ●循环迭代第二步和第三步操作,直到中心点稳定或者达到迭代次数,停止计算操作

例如,10000个样本,每次拿1000个样本,做一次K-means,无放回。

  再取1000个......


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM