bert三種pooling策略對比

notes：因為基本上沒有用過原生的bert做過句向量，所以別人冷不丁一問起，筆者頓時三臉懵逼

Sentence-BERT在BERT/RoBERTa的輸出結果上增加了一個pooling操作，從而生成一個固定大小的句子embedding向量。實驗中采取了三種pooling策略做對比：參考

直接采用CLS位置的輸出向量代表整個句子的向量表示

MEAN策略，計算各個token輸出向量的平均值代表句子向量

MAX策略，取所有輸出向量各個維度的最大值代表句子向量

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 redis三種模式對比三種分布式爬蟲策略 redis三種集群策略 redis三種集群策略 [轉]Golang開發三種IDE的對比 java中三種for循環之間的對比 Java——反射三種方式的效率對比 NLP之文本分類：「Tf-Idf、Word2Vec和BERT」三種模型比較 redis-緩存失效三種策略（FIFO 、LRU、LFU）基於Redis的三種分布式爬蟲策略