《任務導向型對話系統——對話管理模型研究最新進展》(2019-12-26)閱讀筆記【每一段都值得好好讀】


原文鏈接:https://mp.weixin.qq.com/s/6wSz8wAi0vrHebZ0EJ2sZA
作者:戴音培、虞暉華、蔣溢軒、唐呈光、李永彬、孫健
發布時間:2019-12-26

1950年,圖靈測試。

第一代對話系統:基於規則的對話系統。

1966年,MIT開發的ELIZA系統,基於模版匹配方法的心理醫療聊天機器人。

1970年,基於流程圖的對話系統,采用有限狀態自動機建模對話流中的狀態轉移。內部邏輯透明,易於調試,高度依賴專家的人工干預,靈活性和可拓展性差。

第二代對話系統:基於統計學方法的數據驅動的對話系統。

最具代表性的是劍橋大學Steve Young教授於2005年提出的基於部分可見馬爾可夫決策過程。Partially Observable Markov Decision Process , POMDP(http://mi.eng.cam.ac.uk/~sjy/papers/ygtw13.pdf)該系統在魯棒性上顯著地優於基於規則的對話系統。但是模型難以維護,可拓展性也比較受限。

第三代對話系統:基於深度學習的對話系統。自然語言理解(A network-based end-to-end trainable task-oriented dialogue system),對話狀態,對話策略(Sample-efficient actor-critic reinforcement learning with supervised data for dialogue management)。

Facebook提出的基於記憶網絡的任務對話系統,第三代對話系統效果優於第二代系統,但是需要大量帶標注數據才能進行有效訓練。

常見的對話系統可分為三類:聊天型,任務導向型和問答型。

隨着用戶對產品體驗的要求逐漸提高,實際對話場景更加復雜,對話管理模塊也需要更多的改進和創新。傳統的對話管理模型通常是建立在一個明確的話術體系內(即先查找再問詢最后結束),一般會預定義好系統動作空間、用戶意圖空間和對話本體,但是實際中用戶的行為變化難測,系統的應答能力十分有限,這就會導致傳統對話系統可拓性差的問題(難以處理預定義之外的情況)。

另外,在很多的真實業界場景,存在大量的冷啟動問題,缺少足量的標注對話數據,數據的清洗標注成本代價高昂。而在模型訓練上,基於深度增強學習的對話管理模型一般都需要大量的數據,大部分論文的實驗都表明,訓練好一個對話模型通常需要幾百個完整的對話 session,這樣低下的訓練效率阻礙了實際中對話系統的快速開發和迭代。

對話管理模型痛點一:可拓展性差

DST + Dialogue Policy

  • 變化的用戶意圖
  • 變化的槽位和槽值
  • 變化的系統動作

對話管理模型痛點二:標注數據少

  • 機器自動標注
  • 對話結構挖掘
  • 數據采集策略

對話管理模型痛點三:訓練效率低


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM