百度大腦UNIT3.0智能對話技術全面解析


智能客服、智能家居、智能助手、智能車機、智能政務……賦予產品智能對話能力是提升產品智能化體驗、高效服務的重要手段,已經開始被越來越多的企業關注並布局。然而,智能對話系統搭建涉及NLP、知識圖譜、語音等一系列技術以及業務知識數據,具有較高的門檻。

百度與IDC聯合調研報告顯示,“企業知識庫累積不夠”“項目投入成本過高””專業人才缺少”等,位列企業在推進對話系統中的首要障礙。百度大腦智能對話系統定制平台UNIT3.0,發布從搭建技能、構建知識、整合語音與知識的全鏈路對話系統搭建技術能力,大幅降低了對話系統的定制成本。

對話式文檔問答,上傳文檔一鍵獲取對話能力

針對處理常見業務問題咨詢的問答技能,UNIT3.0推出了文檔問答能力,開發者無需梳理意圖、詞槽,無需進行問題和答案的整理,只需准備文本格式的業務文檔,通過平台上傳,即可一鍵獲取基於文檔的對話技能。

【對話式文檔問答技術】

對話式文檔問答技能,可以對傳統需要人工抽取FAQ或意圖的業務文檔進行自動學習,通過搜索與語義理解技術,構建了用戶輸入的問題與業務文檔之間的橋梁,使得用戶的問題可以由技能自動找到文檔中的對應答案片段,使用端到端的多文檔閱讀理解模型V-NET和自然語言生成技術,技能得以返回更為精准的答案。整個問答技能的構建對開發者來說沒有任何技術門檻,且對話式文檔問答技能具有自主學習能力,可持續優化,大大提高問答系統的開發人效。

 

image.png

 

 

【如何體驗對話式文檔問答】

開發者登錄UNIT平台,進入“創新技術”區,點擊“對話式文檔問答“即可申請體驗。

 

image.png

 

 

語音語義一體化方案,更強理解與容錯、低集成成本、短響應時延

在電話客服場景里,時常會出現用戶沉默、打斷和噪聲混入等情況,機器人在應對這些異常情況的時候,需要語音和語義理解技術進行處理,才能實現用戶和機器人的流暢交談。為此,UNIT帶來了全新的語音語義一體化解決方案,幫助企業解決語音交互過程中的難題。整個方案包含以下內容:

(1)降低集成開發成本

提供語音識別、語義理解、對話流程控制、知識庫、語音合成的打通方案,全雙工對話能力,一體化的部署方案,省去開發者對各環節自行調用、拼裝的學習成本以及二次開發成本。

(2)標准協議快速接入

提供基於unimrcp框架開發的mrcpserver服務接入包,通過標准協議適配不同呼叫中心設備(主流的freeswitch、avaya、及基於mrcp標准協議自主研發的呼叫中心設備)。

(3)場景定制服務提升效果

方案中自帶基於百度大腦呼叫中心下的通用ASR、語義糾錯,打斷策略,TTS模型,也可以基於開發者的業務場景,提供模型定制訓練服務,定向提升業務准確率。

(4)極少量開發,輕松實現對話流程

提供Taskflow配置管理能力,開發者可在梳理業務流程后,通過少量代碼快速配置對應的對話流程,后續可直接零代碼在UNIT平台上進行拖拽式配置。

 

image.png

 

 

【如何獲取語音語義一體化能力】

開發者可以進入UNIT官網——解決方案——語音語義一體化方案頁面,了解技術詳情並體驗真實對話樣例。https://ai.baidu.com/unit/v2/static/voice

 

image.png

 

 

體驗真實對話樣例

 

image.png

 

 

數據生產工具DataKit,大幅提升樣本生產和標注效率

在智能對話項目搭建的過程中,高效篩選、處理對話日志並將其轉化為新的訓練數據,是對話系統效果持續提升的重要環節,也是當前開發者面臨的難題之一。為此UNIT推出學習反饋閉環機制,提供數據獲取、輔助標注工具DataKit,幫助企業提升數據處理效率。

DataKit是面向開發者提供的數據生產工具集,利用交互式學習、規則樣本生成和多模型一致性檢驗等技術方法自動獲取大量數據,並從中篩選出帶標注、半標注和無標注3類樣本,這些樣本經過高效的預處理后形成新的訓練數據,可進一步提升語義解析效果,有效提升對話系統的優化人效。

DataKit背后的技術】

1. 交互式學習技術

交互學習是以用戶交互行為數據為基礎,積累交互樣本,解決系統效果瓶頸的迭代優化輔助方案。交互學習主要包含話術干預技術和異常樣本發現技術。

2. 規則樣本生成技術

在UNIT平台上開發者可以方便地配置模板得到語義解析結果,實現語義解析的快速冷啟動。在模板配置達到比較好的語義解析效果時,利用規則樣本生成技術,產生帶標注的樣本集合進行深度訓練,更進一步提升語義解析效果,有效降低人力投入。

3. 多模型一致性檢驗技術

多模型一致性檢驗是日志挖掘的一種有效方法,檢驗UNIT上多個解析模型的結果,假設多個模型的解析結果越一致,其解析正確率越高。其中,具有高正確率的樣本可以直接作為訓練正例,解析為負例的樣本可以直接作為負例,當前沒有解析結果的樣本可以進一步進行人工校驗,不斷優化解析效果。

【如何使用DataKit】

周期性的在UNIT平台下載生產環境的日志,利用Python腳本挖掘日志,對挖掘出來對話樣本文件進行處理。對於正例樣本,可以直接導入對話技能的樣本集里作為訓練數據;負例樣本,可簡單審閱后在對話技能的訓練數據中創建一個單獨的負例樣本集,導入該文件,作為負例訓練數據,在下次訓練時選擇使用;而對於無結果樣本,應該識別卻沒有識別的,篩選出來導入樣本集進行人工標注。那些不應該識別的樣本,則導入負例樣本集。

知識圖譜與對話,助力梳理復雜圖譜知識

越來越多的企業想要在電商客服、法律顧問等領域做一套包含行業知識的智能對話系統,而行業或領域知識的積累、構建、抽取等工作對於企業來說是個不小的難題,百度大腦UNIT3.0推出「我的知識」版塊專門為開發者提供知識建設幫助。在行業智能化的實現進程中,通過知識圖譜對數據進行提煉、萃取、關聯、整合,形成行業知識或領域知識,讓機器形成對於行業工作的認知能力,並把這些認知能力與技能理解模型進行整合,從而實現這個行業的知識型對話系統。

人機對話流程中涉及的語言理解、對話決策、信息查詢、語言組織等重要環節,都需要語言知識、世界知識以及必要的領域知識的指導。其中,知識圖譜(Knowledge Graph,KG)是應用最為廣泛的知識表示形式之一。知識圖譜以圖譜的形式描述真實世界的實體及其內在關系,用模式定義可能的類和實體關系,允許任意實體彼此潛在相互關聯,並涵蓋各種主題領域。

在UNIT平台中,知識圖譜的具體應用可划分為三種模式:

1) 第一種模式對應問答型對話系統,該類對話系統將知識圖譜視為答案信息來源,通過對話理解將用戶問題轉化為對知識圖譜的查詢,直接得到用戶問題的答案。

2) 第二種模式將知識圖譜視為用於對話理解的知識源,借助知識圖譜中元素的屬性及關系,為用戶話語和對話上下文的語義理解提供輔助。

3) 第三種模式對應主動對話場景,借助知識圖譜中概念、屬性 和關系之間的關聯,通過話題推薦等策略實現對話過程的主動引導。

【知識圖譜技術】

UNIT-我的知識整體組成如下:

平台:UNIT為托管知識圖譜提供了的整套平台化支持。

算法:提供了圖譜生產和應用環節的一套豐富的高質量算法。

架構:包含圖譜生產架構,圖譜存儲架構,圖譜算法架構,圖譜應用架構。

 

image.png

 

 

知識圖譜的核心技術包括知識表示、知識抽取、知識消岐與融合、知識存儲。UNIT平台上“我的知識-圖譜/問答知識庫”部分為開發者提供了知識挖掘與管理工具。這些積累的知識可用於提高模型理解能力、完善對話管理能力、實現對話系統的知識建設閉環。

 

image.png

 

 

對話流管理工具Taskflow,靈活定制復雜任務的對話流程

Taskflow是UNIT推出的新一代對話管理技術,開發者可通過簡潔直觀的圖形化配置(后續版本升級提供,目前是通過配置文件完成配置),高效定制屬於自己的對話管理能力。開發者可以使用Taskflow實現一個對話場景下復雜的流程性對話的任務設計,比如咖啡店的訂咖啡、航空公司的訂票退票、保險公司的車險報案等,在這些對話流程中可以實現不同對話意圖中關鍵信息的靈活收集,也可以實現多個意圖之間的跳轉,以及對話過程中一個意圖被打斷后的對話恢復等。

Taskflow技術】

在Taskflow中,UNIT提供執行條件判斷、對話狀態跟蹤、應答動作及話術生成等一系列基礎能力單元,開發者只需根據自身需求進行靈活組裝,即可實現對話管理能力。對於復雜對話邏輯需求也可以借助Taskflow的雲端編程能力在較低成本下實現。同時Taskflow中還提供資源調用能力,一鍵接入領域資源,讓對話鏈路更加完整。UNIT平台當前開放配置接口,開發者直接使用流程圖來描述對話邏輯,並將流程圖配置輸入Taskflow執行,大大提高對話邏輯的實現效率。

 

image.png

 

嵌入式對話理解技術,提供定制化離在線融合框架

在AIoT領域中,大多場景都要求終端具備本地自主決斷及響應能力,每個設備端都需要具備不依賴雲端的獨立計算能力,完成智能對話的本地解析,實現端計算,讓設備無論在什么網絡環境下都能夠響應用戶對話。針對這種場景的痛點,UNIT 3.0推出嵌入式對話理解技術,結合語音的本地識別能力,可以實現本地化不聯網的語義識別,再結合雲端的AI,讓本地和雲端有效配合,以滿足用戶隨時隨地的對話需求。

在線服務具備更好的對話理解與滿足,離線能力保證設備在各種環境下的核心智能交互穩定性;UNIT3.0提供了離在線融合的對話理解框架,開發者可以根據自身的業務情況,靈活選擇離線與在線能力。

 

image.png

 

 

除此之外,UNIT3.0也從技能管理、對話管理、知識接入三個緯度進一步升級了技能與知識管理能力,幫助開發者整合對話、問答技能,接入知識,通過單一接口一站式滿足復雜的對話系統研發。技能管理實現多技能順序可調,並共享全局記憶;對話管理方面具有在線與離線可編程對話管理框架,可適應多樣化的業務場景;知識接入方面具備圖譜知識庫、關系數據庫,基於HTTP服務知識信息的全面支持接入。

百度大腦智能對話引擎一直致力於為企業和個人開發者提供專業、靈活、低成本的對話定制能力,打造能力最全、規模最大的對話系統定制平台,與用戶的累計交互次數超過1380億次。未來,百度也將持續發力智能對話,擁抱開放,讓開發者平等、便捷地獲取更低成本、更好效果的智能對話技術。

相關文章閱讀:

百度大腦UNIT3.0解讀之對話式文檔問答——上傳文檔獲取對話能力

百度大腦UNIT3.0詳解之語音語義一體化方案

百度大腦UNIT3.0詳解之數據生產工具DataKit

百度大腦UNIT3.0詳解之知識圖譜與對話

百度大腦UNIT3.0詳解之嵌入式對話理解技術

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM