【文章推荐】论文笔记之：Deep Reinforcement Learning with Double Q-learning

原文：论文笔记之：Deep Reinforcement Learning with Double Q-learning

Deep Reinforcement Learning with Double Q learning Google DeepMind Abstract 主流的 Q learning 算法过高的估计在特定条件下的动作值。实际上，之前是不知道是否这样的过高估计是 common的，是否对性能有害，以及是否能从主体上进行组织。本文就回答了上述的问题，特别的，本文指出最近的 DQN 算法，的确存在在玩 A ...

2016-06-27 15:39 0 5332 推荐指数：

查看详情

文献笔记:Deep Reinforcement Learning with Double Q-learning

该文章是针对Hado van Hasselt于2010年提出的Double Q-learning算法的进一步拓展，是结合了DQN网络后，提出的关于DQN的Double Q-learning算法。该算法主要目的是修正DQN中max项所产生的过高估计问题，所谓过高估计，在前面的博客Issues ...

论文笔记之：Deep Recurrent Q-Learning for Partially Observable MDPs

Deep Recurrent Q-Learning for Partially Observable MDPs 　摘要：DQN 的两个缺陷，分别是：limited memory 和 rely on being able to perceive the complete game ...

论文笔记之：Continuous Deep Q-Learning with Model-based Acceleration

Continuous Deep Q-Learning with Model-based Acceleration 　　本文提出了连续动作空间的深度强化学习算法。　　开始正文之前，首先要弄清楚两个概念：Model-free 和 Model-based。引用周志华老师 ...

论文笔记之：Dueling Network Architectures for Deep Reinforcement Learning

Dueling Network Architectures for Deep Reinforcement Learning ICML 2016 Best Paper 　摘要：本文的贡献点主要是在 DQN 网络结构上，将卷积神经网络提出的特征，分为两路走，即：the state ...

论文笔记之：Playing Atari with Deep Reinforcement Learning

Playing Atari with Deep Reinforcement Learning 《Computer Science》, 2013 　　Abstract：　　本文提出了一种深度学习方法，利用强化学习的方法，直接从高维的感知输入中学习控制策略。模型是一个卷积神经网络 ...

论文笔记之：Asynchronous Methods for Deep Reinforcement Learning

　　 Asynchronous Methods for Deep Reinforcement Learning ICML 2016 　　深度强化学习最近被人发现貌似不太稳定，有人提出很多改善的方法，这些方法有很多共同的 idea：一个 online 的 agent 碰到的观察到的数据 ...

论文笔记之：Active Object Localization with Deep Reinforcement Learning

Active Object Localization with Deep Reinforcement Learning ICCV 2015 　　最近Deep Reinforcement Learning算是火了一把，在Google Deep Mind的主页上，更是许多关于此 ...

Deep Learning 论文笔记 (3): Deep Learning Face Attributes in the Wild

的识别效果。这篇论文的主要思想是通过学习两个deep network来构建face attrib ...

原文：论文笔记之：Deep Reinforcement Learning with Double Q-learning

相关推荐

相关标签