改進Bert----spanBERT

本文轉載自查看原文 2019-08-19 19:08 724 NLP

SpanBERT: Improving Pre-training by Representing and Predicting Spans

解讀SpanBERT:《Improving Pre-training by Representing and Predicting Spans》

中文預訓練BERT-wwm（Pre-Trained Chinese BERT with Whole Word Masking）

引入了新的目標函數，span-boundary objective (SBO)。把一個句子里的一部分span進行mask，然后用mask token旁邊的token來預測masked span里的每一個token。在QA，conreference resolution, RE三個任務的數據集上實現了SOTA。使用了外部KG，而且用了BERT large。

Facebook推出RoBERTa新模型，碾壓XLNet 制霸三大排行榜

哈工大訊飛聯合實驗室發布中文BERT-wwm-ext預訓練模型

改進版的RoBERTa到底改進了什么？

重回榜首的BERT改進版開源了，千塊V100、160GB純文本的大模型

BERT 預訓練

BERT、ERNIE以及XLNet學習記錄

Google BERT詳解

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 BERT-wwm、BERT-wwm-ext、RoBERTa、SpanBERT、ERNIE2 Bert不完全手冊3. Bert訓練策略優化！RoBERTa & SpanBERT 什么是BERT？ BERT模型 bert微調（1）從RNN到BERT Transformer、BERT BERT模型 BERT模型關於bert的整理