相關內容簡體繁體

學習筆記（37）- CrossWOZ和ConvLab2

本文轉載自查看原文 2020-03-19 08:17 1031 學習筆記

本文僅供學習使用

CrossWOZ清華大學CoAI實驗室做的任務型中文跨域對話系統數據集，模擬北京游客進行酒店、景點、餐館、地鐵、出租車共5個領域進行對話。
文中詳細介紹了多輪對話的NLU、DST、Policy、NLG各個模塊。
提供了基准實驗，基於ConvLab2和基於規則。

作者解讀了自己的論文。

CrossWOZ

大規模中文多域任務型對話數據集

human-to-human dialogue

旅游信息Hotel、Attraction、Restaurant；Metro從旅游信息抽取；Taxi對接API

slot是人工設定的。景點的門票、開放時間；餐館的菜單等；

NLG: BLUE高不代表生成效果好。

采集數據。
生成目標。Domain、Slot、Value。隨機采樣，定義約束。
收集對話。構建網站，聘請人工，上下文依賴的對話，保證一致性。
對話標注

語料統計

基准

ConvLab-2

PyDial：關注對話策略的強化學習
ParlAI：支持多種任務：閱讀理解、QA。需要自己寫模塊化的代碼
ConvLab：模塊層次的評估。不是用戶模擬器的交互評估，不是機器跟機器的完整對話。corpus表現好，不代表真實表現好。
Rasa和Plato：用於生產環境，工程師快速搭建對話系統。例如公眾號，查天氣。脫離研究。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Android學習筆記37：使用Content Providers方式共享數據 Flutter學習筆記（37）--動畫曲線Curves 效果吳恩達機器學習筆記37-學習曲線（Learning Curves） Springcloud學習筆記37--任務調度框架Quartz 使用(Cron表達式)與@scheduled注解定時任務 python筆記37-史上最好用的發郵件zmail opencv學習之路（37）、運動物體檢測（二） uniGUI學習之獲取GET方式的參數然后動態,顯示頁面（37）深度學習面試題37：LSTM Networks原理(Long Short Term Memory networks) Android學習系列(37)--App調試內存泄露之Context篇(下) （數據科學學習手札37）ggplot2基本繪圖語法介紹

粵ICP備18138465號 © 2018-2026 CODEPRJ.COM