簡單說一下所謂Knowledge base(知識圖譜)有兩條路走,一條是
對用戶的問題進行語義理解,一般用Semantic Parsing(語義分析),語義分析有很多種,比如有用CCG、DCS,也有用機器翻譯來做的。它得到了一個句子的邏輯表示,根據邏輯表示再到知識庫里去查,查到這個結點是什么,關系是什么等,通過這種方式,自然而然就查到了。
還有一種辦法就是最近幾年流行的
信息檢索方法。比如,一個問題“where was Barack Obama born ?”這句話里出現的了一個實體——Obama,假設這個知識庫是完備的,那么系統就會判斷答案一定是跟Obama關聯的某個結點,這樣就可以到知識庫里以Obama為半徑,把跟它有關的詞全部挖出來,然后系統要算相似度,相似度算的時候有一種辦法,是把這個知識圖譜的某一個知識單元用自然語言表征出來,也可以用詞嵌入做一個多維向量表示。這時候做一個Ranker跟當前的問題算一個距離,距離近的就是它的答案。我們也將這些技術運用在了微軟小冰里,比如小冰回答問題,跟你聊天等等。
作者:微軟亞洲研究院
鏈接:https://www.zhihu.com/question/23952075/answer/161605738
來源:知乎
著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請注明出處。