A Survey on Knowledge Graphs:Representation, Acquisition and Applications論文閱讀摘要(一)綜述


論文標題(A Survey on Knowledge Graphs:Representation, Acquisition and Applications)
下載鏈接:https://arxiv.org/abs/2002.00388

知識圖譜(Knowledge Graph)

知識圖譜是對事實的結構化表示,由實體、關系和語義描述構成。

  • 實體可以是真實世界的對象也可以是抽象的概念
  • 關系代表實體之間的關系
  • 語義描述包含具體有定義明確的類型和屬性

知識圖譜與知識庫同義,但稍有不同。當考慮知識圖譜的圖結構時,它可以看作是一個圖,當它涉及形式語義的時候,它可以作為對事實進行解釋和推理的知識庫。
在資源描述框架下(RDF),知識可以事實三元組的形式(head,relation,tail)或(subject,predicate,object)的形式表示;知識也可以表示為為一個有向圖,其中節點是實體,邊是關系

歷史背景

  • 誕生:
    最早可以追溯1956年Richens提出的semantic net(語義網)概念

  • 一般問題求解
    符號邏輯知識可以追溯到1959年的一般問題求解器。知識庫首次被使用於基於知識的推理和問題解決系統。
    其中MYCIN是當時著名的基於規則的醫學診斷專家系統之一,它的知識庫大約有600條規則。

  • 19世紀末
    后來,人類知識表示的社區看到了基於框架的語言、基於規則和混合表示的發展。
    大約19世紀末,Cyc項目開始(1984)。
    資源描述框架RDF(1999)和Web本體語言OWL(2004)相繼發布,成為語義網絡的重要標准
    依次誕生:Cyc,RDF(Resource description framework) , OWL(Web Ontology Language) => 變成Semantic Web的重要標准


    隨后,許多開放知識庫或本體被發布:
    WordNet,DBpedia,YAGO,and Freebase => Stokman and Vries提出了結構知識的現代概念

  • 2012年
    Google搜索引擎發布 => 讓知識圖譜變得更加受關注
    與此同時提出了知識融合框架(Knowledge Vault)來構建大規模知識圖譜


研究的總體分類

包含四個主要方面:
1)知識圖譜表示學習(KRL)
2)知識圖譜獲取
3)時序知識圖譜
4)知識感知應用
簡單圖示:

知識表示學習KRL(Knowledge Representation Learning)

KRL是知識圖譜的關鍵研究問題,為許多知識獲取任務和后續下游應用鋪平道路。
作者將它分為4個方面

  • 表示空間 representation space
    實體和關系是如何表示的

  • 打分函數 scoring function
    測量事實三元組的合理性

  • 編碼模型 encoding models
    表示和學習關系交互的編碼模型

  • 輔助信息 auxiliary information
    將輔助信息嵌入到方法中

表示學習包括:point-wise space點向空間、manifold流形、complex verctor space復向量空間、Gaussian distribution高斯分布和discrete space離散空間
打分制通常分為:distance-based(基於距離)similarity matching based(基於相似性匹配)的打分函數
輔助信息包括:文本信息、視覺信息和類型信息。

現階段的研究方向關注在編碼模型,包括linear/bilinear models(線性/雙線性模型)factorization(因式分解)neural network(神經網絡)

知識獲取(Knowledge Acquisition)

知識獲取任務分為三類:

  • 知識圖譜補全 KGC(Knowledge Graph Completion)
    分為:

    • 基於嵌入的排序 embedding-based ranking
    • 關系路徑推理 relation path reasoning
    • 基於規則的推理 rule-based reasoning
    • 元關系學習 meta relational learning
  • 關系提取 RE(relation extraction)
    運用了:

    • 注意力機制 attention mechanism
    • 圖卷積網絡 graph convolutional networks (GCNs)
    • 對抗訓練 adversarial training
    • 強化學習 reinforcement learning
    • 深度殘差學習 deep residual learning
    • 轉移學習 transfer learning
  • 實體發現 entity discovery
    包括:

    • 識別 recognition
    • 消除歧義 disambiguation
    • 類型化 typing
    • 校准(對齊) alignment

第一個用於擴展現有的知識圖譜,而另外兩個是從文本中發現新知識(即關系和實體)

時序知識圖譜(Temporal Knowledge Graphs)

時序知識圖譜結合時序信息進行表示學習,此研究分為4個領域:
1)時序嵌入 (temporal embedding)
2)實體動態 (entity dynamics)
3)時序關系依賴(temporal relational dependency)
4)時序邏輯推理( temporal logical reasoning)

知識感知應用(Knowledge-aware Applications)

包括:

  • 自然語言理解 natural language understanding (NLU)
  • 問答系統 question answering
  • 推薦系統 recommendation systems
  • 各種現實世界任務 miscellaneous real-world tasks

這些應用程序注入知識以促進表示學習

發展前景和方向

復雜推理 Complex Reasoning

知識表示和推理的數值計算需要一個連續的向量空間來捕獲實體和關系之間的語義。雖然嵌入式方法對復雜邏輯推理有局限性,但關系路徑符號邏輯的兩個方向值得進一步探索。一些很有前途的方法比如:循環關系路徑編碼、基於GNN的消息傳遞知識圖譜、基於強化學習的路徑查找和推理等,都是處理復雜推理的新方法。

對於邏輯規則和嵌入的組合,最近的一些工作將馬爾可夫邏輯網絡(Markov logic network)與KGE結合起來,旨在利用邏輯規則並處理它們的不確定性。
利用有效的嵌入實現對不確定性和領域知識的概率推理將是一個值得關注的研究方向。

統一的框架 Unified Framework

大多數的工作都用不同的模型分別制定了知識獲取KGC和關系提取,Han等人提出將它們置於同一屋檐下,並提出了一個相互關注的知識圖譜和文本信息共享的聯合學習框架
對知識表示和推理的統一理解很少被探索,但是,以一種類似於圖網絡結構的統一框架的方式進行統一的研究值得探索。

可解釋性 Interpretability

最近的神經模型在透明性和可解釋性方面有局限性,盡管它們獲得了令人印象深刻的性能。一些方法結合黑盒神經模型和符號推理,通過結合邏輯規則來提高互操作性。可解釋性可以說服人們相信預測。因此,進一步的工作應涉及提高預測知識的可解釋性和可靠性。

可擴展性 Scalability

可擴展性在大規模的知識圖譜中是至關重要的。

知識聚合 Knowledge Aggregation

全球知識的聚集是知識感知應用的核心。例如:推薦系統使用知識圖譜對用戶-項目相互和文本分類進行建模,將文本和知識圖譜編碼到語義空間中。現有的知識聚合方法大多設計了注意力機制和GNNs等神經結構。自然語言處理社區通過Transformer和BERT模型等變體的大規模預訓練得到了發展。與此同時,最近的一項發現表明,對在非結構化文本上的預訓練語言模型可以獲得某些事實知識。大規模的預訓練可以是一種直接的知識注入方式。然而,以一種有效的、可解釋的方式重新思考知識聚合的方式也具有重要意義。

自動構造 Automatic Construction and Dynamics

當前的知識圖譜高度依賴手工構造,這是勞動密集型且是昂貴的。知識圖譜在不同認知智能領域的廣泛應用,需要從大規模的非結構化內容中自動構建知識圖譜。近年來的研究主要是在半自動建設,面對多模態、異構和大規模應用,自動化建設仍然是一個巨大的挑戰。
主流研究集中在靜態知識圖譜上,包括預測時間范圍的有效性,學習時間信息和實體動力學。許多事實只在一個特定的時期成立。動態知識圖譜以及捕獲動態的學習算法,可以通過考慮時間性質來解決傳統知識表示和推理的局限性。


**僅供自己學習使用,如有錯誤歡迎指出**


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM