初學者入門知識圖譜必看的能力:推理


摘要:本文從知識推理的基本概念出發,通俗易懂得介紹了知識圖譜知識推理的應用和方法。

本文分享自華為雲社區《0基礎入門知識圖譜的超能力——知識推理》,作者:Cheri Chen。

一、知識推理的概念

推理是運用邏輯思維能力,從已有的知識出發,得出未知的、隱性的知識。

具體到知識圖譜中,所謂的知識推理,就是利用圖譜中現有的知識(三元組),得到一些新的實體間的關系或者實體的屬性(三元組)。如下圖所示:假如原來的知識圖譜中有這樣兩個三元組,<姚明,妻子,葉莉>和<姚明,女兒,姚沁蕾>,通過知識推理,可以得到<姚明,女兒,姚沁蕾>。

二、知識推理的應用

知識補全

實際構建的知識圖譜,通常存在不完備的問題,即部分關系或屬性會缺失。知識補全呢,就是通過算法,補全知識圖譜中缺失的屬性或者關系。

如下圖所示,以“姚沁蕾的媽媽是誰”為例。有一條常識是 “父親的妻子是媽媽”,則可依據該常識,推理出姚沁蕾的媽媽是葉莉,進而補全“姚沁蕾”和“葉莉”之間的關系,提升我們這個簡單的人物關系知識圖譜的完備性。

知識糾錯

實際構建的知識圖譜還可能存在錯誤知識。其中,實體的類型、實體間的關系、實體屬性值均可能存在錯誤。知識圖譜的糾錯是一個極具挑戰的任務。這些錯誤會影響知識圖譜質量,進而影響基於知識圖譜的應用。

我們可以通過推理進行知識圖譜糾錯(如下圖)。比如,在某個影視知識圖譜中,虛線框中的實體《春光燦爛豬八戒》,其類型為“電影“。它的屬性有集數,主題曲、片尾曲等。而其他同為”電影“類別的實體,其屬性多包含上映時期、票房,且大多沒有集數這個屬性。則推理可知,《春光燦爛豬八戒》這個實體的類型大概率存在錯誤,其正確類型應該是電視劇。

推理問答

基於知識圖譜的推理問答也是知識圖譜推理的典型應用。基於知識圖譜的問答,一般簡稱為KBQA。與傳統的信息檢索式問答相比,KBQA可以具備一定的推理能力,這是它的優勢。基於知識圖譜的推理問答,通常應用於涉及多個實體,多個關系,多跳,比較等相對復雜的問答場景中。

比如,“劉德華主演的電影中豆瓣評分大於8分的有哪些?“這樣的問題。需要機器對該問題進行解析、理解,在知識圖譜中完成查詢、推理、比較動作,找到《天下無賊》和《無間道》作為答案返回(如下圖所示)。

三、知識推理的方法

基於本體的推理

本體是對領域中概念和概念之間關系的描述。基於本體的推理是利用本體已經蘊含的語義和邏輯,來對實體類型以及實體之間的關系進行推理。本體的描述形式是有規范的。RDFS、OWL等是一類滿足特定規范和講究的用來表述本體的語言。

以RDFS為例:RDFS定義了一組用於資源描述的詞匯:包括class,domain,range等。其本身就蘊含了簡單的語義和邏輯。我們可以利用這些語義和邏輯進行推理。

如下圖中左側的例子,谷歌的類型是一家人工智能公司,而人工智能公司又是高科技公司的子類,那么可推理,谷歌的也是一家高科技公司。右側例子中,定義了投資這種關系的domain是投資人,range是公司。可以簡單的認為,投資這種關系的頭節點都是投資人這種類型、尾節點都是公司這種類型。假設現在有一條事實是大衛 切瑞頓 投資 谷歌 。則可以推理出,大衛 切瑞頓的類型是投資人。這兩個例子呢,便是利用了RDFS本身蘊含的語義和邏輯,來進行推理。

基於規則的推理

基於規則的推理就是說,可以抽象出一系列的規則,將這些規則應用於知識圖譜中,進行補全糾錯。這種思路也是很簡單、直觀的。基於規則的推理的優點是,推理結果精准,並且具有可解釋性。因此規則推理在學術界和工業界都有廣泛的應用。

圖中的例子,是人工定義了一些規則,包括“B是A的妻子,則A是B的丈夫”、“B是A的女兒,則A是B的父親”等等。運用這些規則來進行推理,進而補全知識圖譜的缺失關系。我們可以利用這些規則,推理出“米歇爾的丈夫是奧巴馬”、“瑪利亞的父親是奧巴馬”等新的知識。

基於表示學習的推理

前兩種方法:本體推理和規則推理,都是基於離散符號的知識表示來推理的。它們具有強邏輯約束,准確度高、易於解釋等優點。但是不易於擴展。基於表示學習的推理,通過映射函數,將離散符號映射到向量空間進行數值表示,同時捕捉實體和關系之間的關聯,再在映射后的向量空間中進行推理。

知識圖譜是由實體和關系組成,通常采用三元組的形式表示:head(頭實體),relation(實體的關系),tail(尾實體) ,簡寫為(h,r,t)。知識表示學習任務就是學習h,r,t的向量表示。如下圖所示,不同的點表示了不同的知識。我們可以找到一個合適的映射函數,讓距離較近的點,在語義上也是相似的。

基於表示學習的推理比較抽象和復雜,這里舉個簡單的例子,推理“姚沁蕾的出生地是哪兒”。

假設我們已經找到了一個完美的映射函數,可以把知識圖譜和一段包含相關信息的文本映射到同一向量空間。再對這些向量進行計算,比如把“姚沁蕾”、“在”、“當地醫院”、“出生”幾個向量簡單相加后,到達了“休斯頓”這個向量,則可以推理出姚沁蕾的出生地是休斯頓。

[2021華為雲 AI 實戰營]——六大實戰營課程單元制,隨進隨學,供大家免費學習。

 

點擊關注,第一時間了解華為雲新鮮技術~


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM