知識圖譜(Knowledge Graph kg)
--------------------------------
1.KG概念的演化
語義網絡--->本體論--->Web--->the semantic Web--->鏈接數據--->知識圖譜
2.KG輔助搜索
Web的理想是萬物的鏈接,搜索的理想是事物的搜索,搜索的理想是事物的搜索
3.KG輔助問答
機器人以及loT設備的只能化:給萬物都掛接一個知識背景庫,對話式的獲取更加需要精准度和可靠度,知識圖譜對於提升用戶體驗更加必不可少
知識圖譜(Knowage Graph,kg)
-----------------------------------------------
0.KG概念演化
語義網絡(1960)--->本體論(1980)--->Web(1989)--->The Semantic Web(1998)--->鏈接數據(2006)--->知識圖譜(2006)
在這個過程中,人工智能研究者陸續提出了大量的知識表示方法,如框架系統、產生式規則、邏輯描述等
知識圖譜得益於Web的發展(更多的是數據層面),有着來源於KR、NLP、Web、AI等多個方面的基因
語義網:從鏈接文本到鏈接數據
谷歌知識圖譜:Things not strings
1.KG輔助搜索:Web的理想是萬物的鏈接,搜索的理想是事物的搜索
2.KG輔助問答:機器人以及loT設備的智能化,給萬物都掛接一個背景知識庫,對話式的信息獲取更加需要提高精准度和可靠度,知識圖譜對於用戶體驗的提升不可缺少
3.KG輔助決策:
4.KG輔助AI:常識的推理
當一個人聽到一句話的時候,他使用自己所有的知識和智能去理解。這不僅包括語法,也包括它的詞匯知識、上下文知識,更重要的,是對相關事務的理解
5.KG本質
------------------------------------
Web視角:像建立文本之間的超鏈接一樣,建立數據之間的語義鏈接,並支持語義
nlp視角:怎么從文本中抽取語義和結構化數據
KR視角:怎么利用計算機符號來表示和處理知識
AI視角:怎么利用知識庫來輔助理解人的語言
DB視角:用圖的方式存儲知識
做好KG要兼容並蓄,綜合利用好KR、NLP、Web、ML、DB等多方面的方法和技術
6.各種知識圖譜的項目。
6.1CYC
(1)CYC是在1984年由Douglas Lenat開始創建。最初的目的是建立人類最大的常識知識庫。典型的常識知識如"Every tree is a plant","Plant die eventaully"等等
(2)CYC知識庫主要由術語Terms和斷言Assertions組成。Terms包含概念、關系和實體的定義。Assertions用來建立Terms之間的關系,這既包括了事實Fact描述,也包含了規則Rule的描述
(3)最新的CYC知識庫包含了50萬條Terms和700萬條Assertions。CYC的主要特點是基於形式化的知識表示方法來刻畫知識。形式化的優勢是可以支持復雜的推理。但是過於形式化也會導致
知識庫的擴展性和應用的靈活性不夠。CYC提供開放版本OpenCyc.
6.2Wordnet
(1)Wordnet是最著名的詞典知識庫,主要用於詞義的消歧
(2)Wordnet組要定義了名詞、動詞、形容詞和副詞之間的語義關系。例如名詞之間的上下位關系(如:“貓科動物”是“貓”的上位詞),動詞之間的蘊含關系(如:“打鼾”蘊含着“睡眠”)等
(3)Wordnet3.0已經包含了15萬個詞和20萬個語義關系
6.3zhishi.
6.4cnSchema:開放的中文知識圖譜,
6.1cnSchema.org是一個基於社區維護的開放的知識圖譜Schema標准。cnSchema分類,數據類型的詞匯集包括了上千種概念pes、屬性和關系等常用概念定義,以支持只是土偶的通用性、復用性和流動性
6.2結合中文的特點。我們復用、鏈接並擴展了Schema.org,Wikidata,Wikidata等已有的知識圖譜Schema標准,為中文領域的開放知識圖譜、聊天汲取人、搜索引擎的優化等提供了參考和擴展的數據描述和接口的定義標准
7.指示圖的技術體系
KG Data更加規范的數據表達,更強的數據關聯,主要急速包括:知識抽取,知識表示,知識問答,語義搜索,可視化,知識鏈接,知識推理,只是眾包以及知識融合等。
8.RDF:Triple based Assertion modle知識表示三元組
Subject(主語)---Predicate(謂語)--->Object(賓語)
如:人工智能之父是圖靈
9.SPARQL簡介:
RDF的查詢語言:基於RDF數據模型
可以對不同的數據集撰寫復雜的連接
由所有主流的圖數據庫支持
Select ? name
WHERE{
?m <bornln> ?city. ?m <hasName> ?name.
?m<bornOnData> ?bd. ?city <foundingYear> ''1718''.
FILTER(regix(str(?bd),''1976''))
}
10.JSON-LD:數據格式交換
入語義數據和Resful Web Service
{
"@context":"http://json-ld.org/contexts/person.jsonld",
"@id":"http://dbpedia.org/resource/john_Lenon"
"name":"John Lennon",
"born":"1940-10-09"
"spouse":"http://dbpedia.org/resource/Cynthia_Lenon"
}
11.知識圖譜的分布式表示-KG Embedding:在保留語義的同時,將知識圖譜中的實體和關系映射到連續的稠密的低維向量空間
第二部分:典型案例的簡介
