梯度下降算法對比（批量下降/隨機下降/mini-batch）

本文轉載自查看原文 2019-02-02 14:08 1208 深度學習/ NG機器學習

大規模機器學習：

線性回歸的梯度下降算法：Batch gradient descent(每次更新使用全部的訓練樣本)

批量梯度下降算法（Batch gradient descent）：

每計算一次梯度會遍歷全部的訓練樣本，如果訓練樣本的比較多時，內存消耗過大。

隨機梯度下降算法：

1、首先將隨機打亂的訓練樣本數據

2、外循環：（一般2—10次即可，若內循環中次數100000以上，則一次即可）

內循環：遍歷所有的訓練樣本，每次梯度下降時使用一個樣本計算梯度。

與批量梯度像算法相比，其下降曲線不停，圖中右側紅色表示批量梯度下降算法，洋紅表示隨機梯度下降算法。

Mini-Batch梯度下降算法

1、設置每次遍歷的樣本數b

2、外循環：

內循環：遍歷所有的樣本，每b個樣本更新一次梯度

對比：

批量下降：每次梯度更新使用全部的樣本

隨機下將：每次梯度更新使用1個樣本

Mini-batch:每次梯度更新使用b個樣本，b>1，小於全部的樣本數。

隨機梯度下降算法的收斂：

1、在更新梯度前計算損失函數：

2、比如：繪制損失函數的曲線每1000個樣本

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 隨機梯度下降、mini-batch梯度下降以及batch梯度下降【深度學習】：梯度下降，隨機梯度下降（SGD），和mini-batch梯度下降 15、優化算法之Mini-batch 梯度下降法梯度下降法（BGD & SGD & Mini-batch SGD） 2-2 理解 mini-batch 梯度下降法隨機梯度下降優化算法-----批量梯度下降，隨機梯度下降，小批量梯度下降優化-最小化損失函數的三種主要方法：梯度下降(BGD)、隨機梯度下降(SGD)、mini-batch SGD 改善深層神經網絡的優化算法：mini-batch梯度下降、指數加權平均、動量梯度下降、RMSprop、Adam優化、學習率衰減機器學習概念之梯度下降算法（全量梯度下降算法、隨機梯度下降算法、批量梯度下降算法）梯度下降、隨機梯度下降和批量梯度下降