百度發布首個大規模隱變量對話模型PLATO - 飛槳PaddlePaddle的文章 - 知乎
https://zhuanlan.zhihu.com/p/131019469
PLATO: Pre-trained Dialogue GenerationModel with Discrete Latent Variable
PLATO:具有離散潛變量的預訓練對話生成模型
PLATO可以靈活支持多種對話,包括閑聊、知識聊天、對話問答等等。
文章最終公布的在三個公開對話數據集上的測試,PLATO都取得了新的最優效果。
為了驗證預訓練模型的效果,論文在3個公開對話數據集上進行了測試:Persona-Chat、Daily Dialog以及DSTC7-AVSD。
- Persona-Chat是典型的知識聊天任務:兩個人講述自己信息(Persona Profiles),並在對話中盡量了解對方;
- Daily Dialog偏向日常閑聊類型;
- DSTC7-AVSD是對話式問答,根據視頻場景信息,兩人進行多輪問答,討論視頻中物體和事件。
requirements.txt:
paddlepaddle == 1.6.0
numpy
nltk
tqdm
regex
python3 -m venv env
source env/bin/active
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
在自己機器試了一下,sh scripts/DailyDialog/baseline_infer.sh
必須要GPU?