【文章推荐】Chain of Thought Prompting Elicits Reasoning in Large Language Models

原文：Chain of Thought Prompting Elicits Reasoning in Large Language Models

Motivation 虽然语言建模方面，NLP模型表现很好，但是在逻辑推理和数值计算领域称其为第二类任务，system task ，即使是目前最大的模型也难以处理某些推理任务，如数学单词问题符号操作和常识性推理。本文探讨了语言模型产生一个连贯的思维链的能力一系列的短句子，模仿一个人在回答一个问题时可能拥有的推理过程。 Introduction 在本文中，我们探索思维链提示 chain of ...

2022-04-12 10:57 0 2547 推荐指数：

查看详情

论文阅读 | Adversarial Training for Large Neural Language Models

本文把对抗训练用到了预训练和微调两个阶段，对抗训练的方法是针对embedding space，通过最大化对抗损失、最小化模型损失的方式进行对抗，在下游任务上取得了一致的效果提升。有趣的是， ...

《Reasoning-RCNN: Unifying Adaptive Global Reasoning into Large-scale Object Detection》笔记

参考：https://zhuanlan.zhihu.com/p/66762531 摘要重点 1.针对问题长尾数据分布、严重的遮挡和类的模糊性 2.现状主流的对象检测范式由于不考虑对象之间的关键语义依赖而单独处理每个对象区域而受到限制 3.创新 Reasoning ...

Large-Scale Adversarial Training for Vision-and-Language Representation Learning

Large-Scale Adversarial Training for Vision-and-Language Representation Learning 2020-06-12 10:25:21 Paper: https://arxiv.org/abs ...

Learning Transferable Visual Models From Natural Language Supervision

CLIP 一个简单的Idea，使用互联网上的图片，进行pre-training（具体的讲，就是使用caption去匹配图片这个task）。在训练结束后，自然语言用来参照学习到的视觉概念。然后进行 ...

论文阅读 | Pre-trained Models for Natural Language Processing: A Survey

参考：机器之心论文：Pre-trained Models for Natural Language Processing: A Survey 首先简要介绍了语言表示学习及相关研究进展；其次从四个方面对现有 PTM (Pre-trained Model) 进行系统分类 ...

0-4评价一个语言模型Evaluating Language Models:Perplexity

有了一个语言模型，就要判断这个模型的好坏。现在假设：我们有一些测试数据，test data.测试数据中有m个句子;s1,s2,s3…,sm 我们可以查看在某个模型下面的概率：我 ...

[paper] On Extractive and Abstractive Neural Document Summarization with Transformer Language Models

...

【NLP-13】ELMo模型（Embeddings from Language Models）

目录 ELMo简介 ELMo模型概述 ELMo模型解析 ELMo步骤总结一句话简介：2018年发掘的自回归模型，采用预训练和下游微调方式处理NLP任务；解 ...

原文：Chain of Thought Prompting Elicits Reasoning in Large Language Models

相关推荐

相关标签