SGD、GD

本文转载自查看原文 2018-10-20 17:17 836 机器学习

GD参考：

https://blog.csdn.net/CharlieLincy/article/details/70767791

SGD参考：
https://blog.csdn.net/CharlieLincy/article/details/71082147

关于SGD，博主的第二个问题。

GD 代码：

SGD代码：

mini-batch代码：

一直不明白SGD和GD相比优势到底在哪。看代码每次迭代两个算法都要遍历一次数据集。没啥区别。

然而。区别就在同样是一次迭代，遍历一次数据集，SGD更新了m次参数，GD只更新了一次。

关于这种随机样本更新的原理，以及SGD自动逃避鞍点的优点，有待进一步研究。

论文待看：Optimization methods for large-scale machine learning.

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 【原创】batch-GD， SGD， Mini-batch-GD， Stochastic GD， Online-GD -- 大数据背景下的梯度训练算法 torch.optim.SGD SGD的动量（Momentum）算法梯度下降法（BGD & SGD & Mini-batch SGD） GD库使用小结---1 docker安装GD扩展 Linux 安装GD库 PHP扩展使用-GD GD库简介和使用 ubuntu 安装 gd