原文:論文筆記:Deep Residual Learning

之前提到,深度神經網絡在訓練中容易遇到梯度消失 爆炸的問題,這個問題產生的根源詳見之前的讀書筆記。在 Batch Normalization 中,我們將輸入數據由激活函數的收斂區調整到梯度較大的區域,在一定程度上緩解了這種問題。不過,當網絡的層數急劇增加時,BP 算法中導數的累乘效應還是很容易讓梯度慢慢減小直至消失。這篇文章中介紹的深度殘差 Deep Residual 學習網絡可以說根治了這種問題 ...

2018-01-07 14:35 3 4048 推薦指數:

查看詳情

論文筆記之:Deep Reinforcement Learning with Double Q-learning

Deep Reinforcement Learning with Double Q-learning Google DeepMind   Abstract   主流的 Q-learning 算法過高的估計在特定條件下的動作值。實際上,之前是不知道是否這樣的過高估計是 common ...

Mon Jun 27 23:39:00 CST 2016 0 5332
論文筆記之:Playing Atari with Deep Reinforcement Learning

Playing Atari with Deep Reinforcement Learning 《Computer Science》, 2013   Abstract:   本文提出了一種深度學習方法,利用強化學習的方法,直接從高維的感知輸入中學習控制策略。模型是一個卷積神經網絡 ...

Tue Jun 21 05:57:00 CST 2016 0 5397
論文筆記(2):A fast learning algorithm for deep belief nets.

論文筆記(2):A fast learning algorithm for deep belief nets. 這幾天繼續學習一篇論文,Hinton的A Fast Learning Algorithm for Deep Belief Nets。這篇論文一開始讀起來是相當費勁的,學習 ...

Wed May 16 07:05:00 CST 2018 0 3986
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM