原文翻译 导读 这篇文章的主要工作在于应用了对抗训练(adversarial training)的思路来解决开放式对话生成(open-domain dialogue generation)这样一个无监督的问题。 其主体思想就是将整体任务划分到两个子系统上,一个是生成器 ...
本文来自李纪为博士的论文Deep Reinforcement Learning for Dialogue Generation。 ,概述 当前在闲聊机器人中的主要技术框架都是seq seq模型。但传统的seq seq存在很多问题。本文就提出了两个问题: 传统的seq seq模型倾向于生成安全,普适的回答,例如 I don t know what you are talking about 。为了 ...
2019-03-04 15:03 1 920 推荐指数:
原文翻译 导读 这篇文章的主要工作在于应用了对抗训练(adversarial training)的思路来解决开放式对话生成(open-domain dialogue generation)这样一个无监督的问题。 其主体思想就是将整体任务划分到两个子系统上,一个是生成器 ...
Hierarchical Object Detection with Deep Reinforcement Learning NIPS 2016 WorkShop Paper : https://arxiv.org/pdf/1611.03718v1.pdf ...
文章:Deep Mutual Learning 出自CVPR2017(18年最佳学生论文) 文章链接:https://arxiv.org/abs/1706.00384 代码链接:https://github.com/YingZhangDUT/Deep-Mutual-Learning ...
Deep Reinforcement Learning with Double Q-learning Google DeepMind Abstract 主流的 Q-learning 算法过高的估计在特定条件下的动作值。实际上,之前是不知道是否这样的过高估计是 common ...
Asynchronous Methods for Deep Reinforcement Learning ICML 2016 深度强化学习最近被人发现貌似不太稳定,有人提出很多改善的方法,这些方法有很多共同的 idea:一个 online 的 agent 碰到的观察到的数据 ...
Dueling Network Architectures for Deep Reinforcement Learning ICML 2016 Best Paper 摘要:本文的贡献点主要是在 DQN 网络结构上,将卷积神经网络提出的特征,分为两路走,即:the state ...
Playing Atari with Deep Reinforcement Learning 《Computer Science》, 2013 Abstract: 本文提出了一种深度学习方法,利用强化学习的方法,直接从高维的感知输入中学习控制策略。模型是一个卷积神经网络 ...
Active Object Localization with Deep Reinforcement Learning ICCV 2015 最近Deep Reinforcement Learning算是火了一把,在Google Deep Mind的主页上,更是许多关于此 ...