tensorflow筆記之反向傳播時用到的幾種方法

本文轉載自查看原文 2018-01-09 21:52 1067 tensorflow筆記/ 優化方法/ 機器學習/ 反向傳播

1. 梯度下降， tf.train.GradientDescentOptimizer(0.05),梯度下降的問題在與不一定能獲得全局最優解，並且因為要在所有數據上最小化損失，所以損失函數是在所有訓練數據上的損失和，所以在大數據情況下，需要的時間相當長。

2.隨機梯度下降，隨機梯度下降優化的不是全部數據上的損失函數，在每一輪迭代中，都隨機選擇一條訓練數據進行優化，這樣訓練時間大大減小，但是由於某一條數據上的全局最小不一定代表所有數據的全局最小，所以隨機梯度下降也不一定能達到全局最優解。

為了綜合梯度下降和隨機梯度下降的優點，在實際訓練中通常將訓練數據分為多個batch，每次只訓練一個batch，這樣可以大大減小收斂所需的迭代次數。

3. MomentumOptimizer()，解決了梯度下降無法跳出局部極小值的問題。

4. AdagradOptimizer()，根據每個變量變換優化步長，考慮了變量梯度的整個歷史。

5. AdadeltaOptimizer()，Adagrad有時候會很快使梯度到0，為了解決這個問題，Adadelta可以限制最少使用多少步。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 angular中的用到的幾種方法總結 rm反向刪除的幾種方法 tensorflow 新建tensor的幾種方法 Tensorflow--卷積的梯度反向傳播 tensorflow進階篇-5(反向傳播1) DL學習筆記-反向傳播算法的理解第十二節，TensorFlow讀取數據的幾種方法以及隊列的使用什么是反向傳播前向傳播與反向傳播 tensorflow 2.0 學習（七）反向傳播代碼逐步實現