原文翻譯 導讀 這篇文章的主要工作在於應用了對抗訓練(adversarial training)的思路來解決開放式對話生成(open-domain dialogue generation)這樣一個無監督的問題。 其主體思想就是將整體任務划分到兩個子系統上,一個是生成器 ...
本文來自李紀為博士的論文Deep Reinforcement Learning for Dialogue Generation。 ,概述 當前在閑聊機器人中的主要技術框架都是seq seq模型。但傳統的seq seq存在很多問題。本文就提出了兩個問題: 傳統的seq seq模型傾向於生成安全,普適的回答,例如 I don t know what you are talking about 。為了 ...
2019-03-04 15:03 1 920 推薦指數:
原文翻譯 導讀 這篇文章的主要工作在於應用了對抗訓練(adversarial training)的思路來解決開放式對話生成(open-domain dialogue generation)這樣一個無監督的問題。 其主體思想就是將整體任務划分到兩個子系統上,一個是生成器 ...
Hierarchical Object Detection with Deep Reinforcement Learning NIPS 2016 WorkShop Paper : https://arxiv.org/pdf/1611.03718v1.pdf ...
文章:Deep Mutual Learning 出自CVPR2017(18年最佳學生論文) 文章鏈接:https://arxiv.org/abs/1706.00384 代碼鏈接:https://github.com/YingZhangDUT/Deep-Mutual-Learning ...
Deep Reinforcement Learning with Double Q-learning Google DeepMind Abstract 主流的 Q-learning 算法過高的估計在特定條件下的動作值。實際上,之前是不知道是否這樣的過高估計是 common ...
Asynchronous Methods for Deep Reinforcement Learning ICML 2016 深度強化學習最近被人發現貌似不太穩定,有人提出很多改善的方法,這些方法有很多共同的 idea:一個 online 的 agent 碰到的觀察到的數據 ...
Dueling Network Architectures for Deep Reinforcement Learning ICML 2016 Best Paper 摘要:本文的貢獻點主要是在 DQN 網絡結構上,將卷積神經網絡提出的特征,分為兩路走,即:the state ...
Playing Atari with Deep Reinforcement Learning 《Computer Science》, 2013 Abstract: 本文提出了一種深度學習方法,利用強化學習的方法,直接從高維的感知輸入中學習控制策略。模型是一個卷積神經網絡 ...
Active Object Localization with Deep Reinforcement Learning ICCV 2015 最近Deep Reinforcement Learning算是火了一把,在Google Deep Mind的主頁上,更是許多關於此 ...