原文:Sentence-BERT: 一種能快速計算句子相似度的孿生網絡

一 背景介紹 BERT和RoBERTa在文本語義相似度等句子對的回歸任務上,已經達到了SOTA的結果。但是,它們都需要把兩個句子同時喂到網絡中,這樣會導致巨大的計算開銷:從 個句子中找出最相似的句子對,大概需要 萬 C , , 個推理計算,在V GPU上耗時約 個小時。這種結構使得BERT不適合語義相似度搜索,同樣也不適合無監督任務 例如:聚類 。 本文基於BERT網絡做了修改,提出了Senten ...

2020-05-12 10:01 1 6879 推薦指數:

查看詳情

孿生網絡(Siamese Network)在句子語義相似計算中的應用

1,概述   在NLP中孿生網絡基本是用來計算句子間的語義相似的。其結構如下        在計算句子語義相似的時候,都是以句子對的形式輸入到網絡中,孿生網絡就是定義兩個網絡結構分別來表征句子對中的句子,然后通過曼哈頓距離,歐式距離,余弦相似等來度量兩個句子之間的空間相似 ...

Wed Jul 17 22:45:00 CST 2019 0 4883
sentence-bert學習筆記

sentence-bert學習筆記 入職以來忙上加忙,少了很多看paper的時間,於是乎筆者決定,可以fellow一些寫論文解析補充的文章,然后直接跑代碼,看效果~ 工程上的東西不能落下,前沿的東西也不能落下,感覺筆者此處有那么一丟丟的對抗網絡的感覺了有木有。 本文可以說是一篇摘抄筆記 參考 ...

Wed Jun 30 17:05:00 CST 2021 0 194
句子相似計算方法

W~J~T~E 一、基本方法  在做自然語言處理的過程中,我們經常會遇到需要找出相似語句的場景,或者找出句子的近似表達,那么求句子相似方法有哪些呢? 編輯距離計算 傑卡德系數計算 TF 計算 TFIDF 計算 Word2Vec 計算 ...

Sun May 05 22:40:00 CST 2019 0 1808
論文閱讀 | Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks

簡述 在文本語義相似句子對的回歸任務上,BERT , RoBERTa 拿到sota。 但是,它要求兩個句子都被輸入到網絡中,從而導致巨大開銷:從10000個句子集合中找到最相似sentence-pair需要進行大約5000萬個推理計算(約65小時)。 BERT不適合語義相似搜索 ...

Thu Dec 12 06:47:00 CST 2019 0 2549
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM