原文:论文阅读 | Generating Natural Language Adversarial Examples through Probability Weighted Word Saliency

论文地址:https: www.aclweb.org anthology P 已有研究工作: 在文本的对抗样本领域,因为有词嵌入的存在,很难将特征空间的扰动向量映射到词汇表中的有效单词。因此在CV领域的方法不能直接用于NLP领域,一般的方法是在词级别或者字符级别直接修改原始样本,来实现对抗性攻击。 本文的工作和创新点: 关注的是文本分类的对抗样本的问题。其主要难点在于,句子空间是离散的,沿梯度方向 ...

2020-04-20 23:50 0 757 推荐指数:

查看详情

论文阅读 | Generating Fluent Adversarial Examples for Natural Languages

Generating Fluent Adversarial Examples for Natural Languages ACL 2019 为自然语言生成流畅的对抗样本 摘要 有效地构建自然语言处理(NLP)任务的对抗性攻击者是一个真正的挑战。首先,由于句子空间是离散的。沿梯度方向 ...

Thu Aug 15 03:56:00 CST 2019 2 408
论文阅读 | Adversarial Training for Large Neural Language Models

本文把对抗训练用到了预训练和微调两个阶段,对抗训练的方法是针对embedding space,通过最大化对抗损失、最小化模型损失的方式进行对抗,在下游任务上取得了一致的效果提升。有趣的是, ...

Thu Oct 15 01:01:00 CST 2020 2 780
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM