原文:Sentence-BERT: 一种能快速计算句子相似度的孪生网络

一 背景介绍 BERT和RoBERTa在文本语义相似度等句子对的回归任务上,已经达到了SOTA的结果。但是,它们都需要把两个句子同时喂到网络中,这样会导致巨大的计算开销:从 个句子中找出最相似的句子对,大概需要 万 C , , 个推理计算,在V GPU上耗时约 个小时。这种结构使得BERT不适合语义相似度搜索,同样也不适合无监督任务 例如:聚类 。 本文基于BERT网络做了修改,提出了Senten ...

2020-05-12 10:01 1 6879 推荐指数:

查看详情

孪生网络(Siamese Network)在句子语义相似计算中的应用

1,概述   在NLP中孪生网络基本是用来计算句子间的语义相似的。其结构如下        在计算句子语义相似的时候,都是以句子对的形式输入到网络中,孪生网络就是定义两个网络结构分别来表征句子对中的句子,然后通过曼哈顿距离,欧式距离,余弦相似等来度量两个句子之间的空间相似 ...

Wed Jul 17 22:45:00 CST 2019 0 4883
sentence-bert学习笔记

sentence-bert学习笔记 入职以来忙上加忙,少了很多看paper的时间,于是乎笔者决定,可以fellow一些写论文解析补充的文章,然后直接跑代码,看效果~ 工程上的东西不能落下,前沿的东西也不能落下,感觉笔者此处有那么一丢丢的对抗网络的感觉了有木有。 本文可以说是一篇摘抄笔记 参考 ...

Wed Jun 30 17:05:00 CST 2021 0 194
句子相似计算方法

W~J~T~E 一、基本方法  在做自然语言处理的过程中,我们经常会遇到需要找出相似语句的场景,或者找出句子的近似表达,那么求句子相似方法有哪些呢? 编辑距离计算 杰卡德系数计算 TF 计算 TFIDF 计算 Word2Vec 计算 ...

Sun May 05 22:40:00 CST 2019 0 1808
论文阅读 | Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks

简述 在文本语义相似句子对的回归任务上,BERT , RoBERTa 拿到sota。 但是,它要求两个句子都被输入到网络中,从而导致巨大开销:从10000个句子集合中找到最相似sentence-pair需要进行大约5000万个推理计算(约65小时)。 BERT不适合语义相似搜索 ...

Thu Dec 12 06:47:00 CST 2019 0 2549
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM