原文:Rainbow: Combining Improvements in Deep Reinforcement Learning

郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布 arXiv: . v cs.AI Oct AAAI Abstract 深度强化学习社区对DQN算法进行了一些独立的改进。但是,尚不清楚这些扩展中的哪些是互补的,是否可以有效地组合。本文研究了DQN算法的六个扩展,并通过经验研究了它们的组合。我们的实验表明,该组合在数据效率和最终性能方面均提供了Atari 基准测试的最新性能。我们还提供了详 ...

2020-08-11 18:02 0 480 推荐指数:

查看详情

Deep Reinforcement Learning for Dialogue Generation 论文阅读

  本文来自李纪为博士的论文 Deep Reinforcement Learning for Dialogue Generation。 1,概述   当前在闲聊机器人中的主要技术框架都是seq2seq模型。但传统的seq2seq存在很多问题。本文就提出了两个问题:   1)传统 ...

Mon Mar 04 23:03:00 CST 2019 1 920
文献笔记:Deep Reinforcement Learning with Double Q-learning

该文章是针对Hado van Hasselt于2010年提出的Double Q-learning算法的进一步拓展,是结合了DQN网络后,提出的关于DQN的Double Q-learning算法。该算法主要目的是修正DQN中max项所产生的过高估计问题,所谓过高估计,在前面的博客Issues ...

Tue Mar 12 03:34:00 CST 2019 0 701
论文笔记之:Deep Reinforcement Learning with Double Q-learning

Deep Reinforcement Learning with Double Q-learning Google DeepMind   Abstract   主流的 Q-learning 算法过高的估计在特定条件下的动作值。实际上,之前是不知道是否这样的过高估计是 common ...

Mon Jun 27 23:39:00 CST 2016 0 5332
论文笔记之:Playing Atari with Deep Reinforcement Learning

Playing Atari with Deep Reinforcement Learning 《Computer Science》, 2013   Abstract:   本文提出了一种深度学习方法,利用强化学习的方法,直接从高维的感知输入中学习控制策略。模型是一个卷积神经网络 ...

Tue Jun 21 05:57:00 CST 2016 0 5397
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM