本文來自李紀為博士的論文 Deep Reinforcement Learning for Dialogue Generation。 1,概述 當前在閑聊機器人中的主要技術框架都是seq2seq模型。但傳統的seq2seq存在很多問題。本文就提出了兩個問題: 1)傳統 ...
原文翻譯 導讀 這篇文章的主要工作在於應用了對抗訓練 adversarial training 的思路來解決開放式對話生成 open domain dialogue generation 這樣一個無監督的問題。 其主體思想就是將整體任務划分到兩個子系統上,一個是生成器 generative model ,利用seq seq式的模型以上文的句子作為輸入,輸出對應的對話語句 另一個則是一個判別器 di ...
2018-01-03 09:28 0 1538 推薦指數:
本文來自李紀為博士的論文 Deep Reinforcement Learning for Dialogue Generation。 1,概述 當前在閑聊機器人中的主要技術框架都是seq2seq模型。但傳統的seq2seq存在很多問題。本文就提出了兩個問題: 1)傳統 ...
本文把對抗訓練用到了預訓練和微調兩個階段,對抗訓練的方法是針對embedding space,通過最大化對抗損失、最小化模型損失的方式進行對抗,在下游任務上取得了一致的效果提升。有趣的是, ...
Sequence to Sequence Learning with NN 《基於神經網絡的序列到序列學習》原文google scholar下載。 @author: Ilya Sutskever (Google)and so on 一、總覽 DNNs在許多棘手的問題處理上取得了矚目 ...
首先,容我吐槽一下這篇論文的行文結構、圖文匹配程度、真把我搞得暈頭轉向,好些點全靠我猜測推理作者想干嘛,😈 背景 我們知道傳統的CNN針對的是image,是歐氏空間square grid,那么使用同樣square grid的卷積核就能對輸入的圖片進行特征的提取。在上一篇論文中,使用的理論 ...
(1)用對抗性的源實例攻擊翻譯模型; (2)使用對抗性目標輸入來保護翻譯模型,提高其對對抗性源輸入的魯棒性。 生成對抗輸入:基於梯度 (平均損失) -> AdvGen ...
Domain-adversarial training of neural networks Abstract 我們介紹了一種新的用於域自適應的表征學習方法,其中訓練和測試時的數據來自相似但不同的分布。我們的方法直接受到域 ...
VSE++: Improving Visual-Semantic Embeddings with Hard Negatives 1 摘要 受到hard negative mining的啟發(在結構 ...
轉載請注明出處:https://www.cnblogs.com/White-xzx/ 原文地址:https://arxiv.org/abs/1812.02425 Github: https://g ...