NLP的比賽和數據集


整理了NLP領域的比賽、數據集、模型

比賽 網站 主辦方(作者)
decaNLP http://decanlp.com/ Salesforce
CLUE https://github.com/CLUEbenchmark/CLUE 中文任務基准
GLUE https://gluebenchmark.com/tasks
BioBERT https://github.com/dmis-lab/biobert 生物醫學領域的NLP任務
ERNIE https://github.com/PaddlePaddle/ERNIE 百度飛槳
ALBERT

decaNLP

自然語言十項全能多任務挑戰

Natural Language Decathlon (decaNLP) 是一個新的基准,要求單獨的系統能夠完成10項獨立的自然語言任務。

  1. 問答 Stanford Question Answering Dataset (SQuAD 1.1)
  2. 機器翻譯 International Workshop on Spoken Language Translation (IWSLT),
  3. 自動摘要 CNN/DailyMail (CNN/DM) corpus.
  4. 自然語言推理 Multi-Genre Natural Language Inference Corpus (MNLI).
  5. 情感分析 Stanford Sentiment Treebank (SST),
  6. 語義標簽標注 QA-SRL 1.0.
  7. 關系抽取 QA-ZRE,
  8. 面向全域的對話 Wizard of Oz (WOZ)
  9. 語義解析 WikiSQL 【Seq2SQL,https://github.com/salesforce/WikiSQL】
  10. 常識推理 Modified Winograd Schema Challenge, MWSC)

評測-GLUE

CoLA、 SST-2、 MRPC、 STS-B、 QQP、 MNLI-m、 QNLI、 RTE

評測-CLUE

  1. 中文任務基准評測CLUE

  2. AFQMC:螞蟻語義相似度(Acc);

  3. TNEWS:文本分類(Acc);

  4. IFLYTEK:長文本分類(Acc);

  5. CMNLI: 自然語言推理中文版;

  6. COPA: 因果推斷;

  7. WSC: Winograd模式挑戰中文版;

  8. CSL: 中國科學文獻數據集;

模型-BioBERT

https://github.com/dmis-lab/biobert

  1. NER
    命名實體識別
  2. RE
    關系抽取
  3. QA
    問答

模型-ERNIE

https://github.com/PaddlePaddle/ERNIE/blob/develop/README.zh.md

  1. 自然語言推斷 XNLI
  2. 閱讀理解 DuReader、CMRC2018、DRCD
  3. 命名實體識別 MSRA-NER(SIGHAN2006)
  4. 情感分析 ChnSentiCorp
  5. 問答任務 NLPCC2016-DBQA
  6. 語義相似度 LCQMC、BQ Corpus

模型-ALBERT

模型-TinyBERT


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM