【文章推荐】RL^2: Fast Reinforcement Learning via Slow Reinforcement Learning

原文：RL^2: Fast Reinforcement Learning via Slow Reinforcement Learning

郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布 ICLR ABSTRACT 深度RL已经成功地自动学习了复杂的行为。但是，学习过程需要大量的试验。相比之下，动物可以通过几次试验而学习新的任务，这得益于它们对世界的了解。本文力图弥合这一差距。与其设计一种快速的RL算法，不如将其表示为RNN并从数据中学习。在我们提出的方法RL 中，该算法以RNN的权重进行编码，这些权重是通过通用慢速 ...

2020-09-06 16:32 0 606 推荐指数：

查看详情

Reinforcement Learning

https://www.bilibili.com/video/av9770302/?p=24 https://www.bilibili.com/video/av24724071/?p=3 http ...

Meta-RL——Efficient Off-Policy Meta-Reinforcement Learning via Probabilistic Context Variables

Meta-RL——Efficient Off-Policy Meta-Reinforcement Learning via Probabilistic Context Variables 作者：凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji ...

Decision Transformer: Reinforcement Learning via Sequence Modeling

发表时间：2021 文章要点：这篇文章提出了一个Decision Transformer的模型，在offline RL的设定下，不直接去拟合数据，不需要做policy improvement，就可以达到甚至超过offline RL baseline。具体做法很简单，就是用transformer ...

A Distributional Perspective on Reinforcement Learning

郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ arXiv:1707.06887v1 [cs.LG] 21 Jul 2017 In International Conference on Machine Learning (2017). Abstract ...

Learning to Reinforcement Learn

郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ CogSci, (2017) ABSTRACT 　　近年来，深度RL系统在许多具有挑战性的任务领域中都获得了超出人类的性能。但是，此类应用的主要局限性在于它们对大量训练数据的需求。因此，当前的一个关键目标是开发能够 ...

在Matlab 上使用 Reinforcement learning

在Matlab 上使用 Reinforcement learning 环境搭建在Matlab中安装Deep Learning Toolbox后安装Reinforcement Learning Toolbox 什么是强化学习强化学习的最终目标是在未知的环境中训练一个agent ...

Distributional Reinforcement Learning with Quantile Regression

郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ arXiv:1710.10044v1 [cs.AI] 27 Oct 2017 In AAAI Conference on Art ...

原文：RL^2: Fast Reinforcement Learning via Slow Reinforcement Learning

相关推荐

相关标签