學習筆記(43)- 百度PLATO:具有離散潛變量的預訓練對話生成模型


百度發布首個大規模隱變量對話模型PLATO - 飛槳PaddlePaddle的文章 - 知乎
https://zhuanlan.zhihu.com/p/131019469

PLATO: Pre-trained Dialogue GenerationModel with Discrete Latent Variable

PLATO:具有離散潛變量的預訓練對話生成模型

PLATO可以靈活支持多種對話,包括閑聊、知識聊天、對話問答等等。
文章最終公布的在三個公開對話數據集上的測試,PLATO都取得了新的最優效果。

為了驗證預訓練模型的效果,論文在3個公開對話數據集上進行了測試:Persona-Chat、Daily Dialog以及DSTC7-AVSD。

  • Persona-Chat是典型的知識聊天任務:兩個人講述自己信息(Persona Profiles),並在對話中盡量了解對方;
  • Daily Dialog偏向日常閑聊類型;
  • DSTC7-AVSD是對話式問答,根據視頻場景信息,兩人進行多輪問答,討論視頻中物體和事件。

requirements.txt:

paddlepaddle == 1.6.0
numpy
nltk
tqdm
regex
python3 -m venv env
source env/bin/active
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

在自己機器試了一下,sh scripts/DailyDialog/baseline_infer.sh
必須要GPU?


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM