原文:A Diversity-Promoting Objective Function for Neural Conversation Models论文阅读

本文来自李纪为博士的论文A Diversity Promoting Objective Function for Neural Conversation Models ,概述 对于seq seq模型类的对话系统,无论输入是什么,都倾向于生成安全,通用的回复 例如 i don t know 这一类的回复 ,因为这种响应更符合语法规则,在训练集中出现频率也较高,最终生成的概率也最大,而有意义的响应生成 ...

2019-02-27 23:46 0 784 推荐指数:

查看详情

论文阅读 | Adversarial Training for Large Neural Language Models

本文把对抗训练用到了预训练和微调两个阶段,对抗训练的方法是针对embedding space,通过最大化对抗损失、最小化模型损失的方式进行对抗,在下游任务上取得了一致的效果提升。有趣的是, ...

Thu Oct 15 01:01:00 CST 2020 2 780
论文阅读 | Target-Guided Open-Domain Conversation

论文地址 :https://www.aclweb.org/anthology/P19-1565/ 作者 : Jianheng Tang, Tiancheng Zhao, Chenyan Xiong, Xiaodan Liang, Eric Xing, Zhiting Hu 机构 : 中山大学 ...

Wed Apr 22 07:59:00 CST 2020 0 654
论文阅读 | Trojaning Attack on Neural Networks

对神经网络的木马攻击 Q: 1. 模型蒸馏可以做防御吗? 2. 强化学习可以帮助生成木马触发器吗? 3. 怎么挑选建立强连接的units? 本文提出了一种针对神经元网络的木马攻击 ...

Wed Aug 14 01:44:00 CST 2019 0 776
《Learning Convolutional Neural Networks for Graphs》论文阅读

首先,容我吐槽一下这篇论文的行文结构、图文匹配程度、真把我搞得晕头转向,好些点全靠我猜测推理作者想干嘛,😈 背景 我们知道传统的CNN针对的是image,是欧氏空间square grid,那么使用同样square grid的卷积核就能对输入的图片进行特征的提取。在上一篇论文中,使用的理论 ...

Mon Apr 20 09:28:00 CST 2020 0 1532
《Diffusion-Convolutional Neural Networks》论文阅读

DCNN 主要思想: 这是一篇基于空间域的图神经网络,聚合方式通过采样(hop)1~k 阶的邻居并同 self 使用 mean 的方式得到新的 feature-vector 作者将不同的 ...

Sat Jun 20 07:12:00 CST 2020 0 1023
Design Challenges and Misconceptions in Neural Sequence Labeling 论文阅读

1,简介   序列标注算是NLP中最基本的任务,主要有分词,词性标注,实体识别三类任务。分词通常是中文任务的模型最基本的组件,词性标注通常也是用来辅助其他的任务,用于提升任务的性能,而实体识别算是可 ...

Mon Sep 07 01:49:00 CST 2020 0 441
论文阅读-(CVPR 2017) Kernel Pooling for Convolutional Neural Networks

在这篇论文中,作者提出了一种更加通用的池化框架,以核函数的形式捕捉特征之间的高阶信息。同时也证明了使用无参数化的紧致清晰特征映射,以指定阶形式逼近核函数,例如高斯核函数。本文提出的核函数池化可以和CNN网络联合优化。 Network Structure Overview Kernel ...

Sun Dec 23 04:32:00 CST 2018 0 639
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM