知識圖譜基礎知識之一——人人都能理解的知識圖譜


1 知識圖譜和人工智能
說起知識圖譜,可能很多人不太了解,但要說到人工智能,大家就耳熟能詳了。人工智能是指機器要像人一樣可以思考,具有智慧。現在這個階段,人工智能研究的人越來越多,在很多行業也實現了部分的人工智能,讓機器代替了人進行簡單重復性的工作。
在這里我們可以把人工智能分為兩個層次,一個是感知層次,也就是聽覺、視覺、嗅覺、味覺等等,目前人工智能在聽覺和視覺方面做的比較好,語音識別,圖像識別,研究的人多,也有產品出來。但總起來說,感知層次的人工智能還沒有體現人類的獨有的智慧,其它動物可能在感知層次比人要好,比如鷹的眼睛,狼的耳朵,豹的速度,熊的力量等等。
真正體現人工智能的還是第二個層次,也就是認知層次,能夠認識這個客觀世界。而認知世界是通過大量的知識積累實現的,小孩子見到狗和貓,見過幾次就能分辨出狗和貓,讓機器來分辨難度就比較大,當然現在通過大數據訓練也在提升。這種認知能力是知識的運用,小孩子見到狗,他就會在潛意識中總結狗的特征,長耳朵,瘦臉,汪汪叫。貓的特征,短耳朵,圓臉,喵喵叫。

這些知識會存儲在人類的大腦中,作為經驗知識,再次碰到類似的動物,人們馬上就從記憶中想起該動物的特征,對號入座,馬上判斷出動物的類型。機器要想具有認知能力,也需要建立一個知識庫,然后運用知識庫來做一些事,這個知識庫就是我們要說的知識圖譜。從這個角度說,知識圖譜是人工職能的一個重要分支,也是機器具有認知能力的基石,在人工智能領域具有非常重要的地位。

2 知識圖譜的由來
知識圖譜(Knowledge graph)首先是由Google提出來的,大家知道Google是做搜索引擎的,知識圖譜出現之前,我們使用google、百度進行搜索的時候,搜索的結果是一堆網頁,我們會根據搜索結果的網頁題目再點擊鏈接,才能看到具體內容,2012年google提出Google Knowldge Graph之后,利用知識圖譜技術改善了搜索引擎核心,表現出來的效果就是我們現在使用搜索引擎進行搜索的時候,搜索結果會以一定的組織結構呈現,比如我們搜索比爾蓋茨,結果如圖所示

這樣的搜索結果,與知識圖譜出現之前的結果有什么區別呢,辛格爾博士對知識圖譜的介紹很簡短,things,not string,抓住了知識圖譜的核心,也點出了知識圖譜加入之后搜索發生的變化,以前的搜索,都是將要搜索的內容看作字符串,結果是和字符串進行匹配,將匹配程度高的排在前面,后面按照匹配度依次顯示。利用知識圖譜之后,將搜索的內容不再看作字符串,而是看作客觀世界的事物,也就是一個個的個體。搜索比爾蓋茨的時候,搜索引擎不是搜索“比爾蓋茨”這個字符串,而是搜索比爾蓋茨這個人,圍繞比爾蓋茨這個人,展示與他相關的人和事,左側百科會把比爾蓋茨的主要情況列舉出來,右側顯示比爾蓋茨的微軟產品和與他類似的人,主要是一些IT行業的創始人。一個搜索結果頁面就把和比爾蓋茨的基本情況和他的主要關系都列出來了,搜索的人很容易找到自己感興趣的結果。

3 知識圖譜是什么
知識圖譜本質上是一種語義網絡,用圖的形式描述客觀事物,這里的圖指的是數據結構中的圖,也就是由節點和邊組成的,這也是知識圖譜(Knowledge Graph)的真實含義。知識圖譜中的節點表示概念和實體,概念是抽象出來的事物,實體是具體的事物;邊表示事物的關系和屬性,事物的內部特征用屬性來表示,外部聯系用關系來表示。很多時候,人們簡化了對知識圖譜的描述,將實體和概念統稱為實體,將關系和屬性統稱為關系,這樣就可以說知識圖譜就是描述實體以及實體之間的關系。實體可以是人,地方,組織機構,概念等等,關系的種類更多,可以是人與人之間的關系,人與組織之間的關系,概念與某個物體之間的關系等等,以下是一個例子。


4 知識圖譜是怎么組織數據的
知識圖譜是由實體和實體的關系組成,通過圖的形式表現出來,那么實體和實體關系的這些數據在知識圖譜中怎么組織呢,這就涉及到三元組的概念,在知識圖譜中,節點-邊-節點可以看作一條記錄,第一個節點看作主語,邊看作謂語,第二個節點看作賓語,主謂賓構成一條記錄。比如曹操的兒子是曹丕,曹操是主語,兒子是謂語,曹丕是賓語。再比如,曹操的小名是阿瞞,主語是曹操,謂語是小名,賓語是阿瞞。知識圖譜就是由這樣的一條條三元組構成,圍繞着一個主語,可以有很多的關系呈現,隨着知識的不斷積累,最終會形成一個龐大的知識圖譜,知識圖譜建設完成后,會包含海量的數據,內涵豐富的知識。

5 知識圖譜的應用場景
知識圖譜構建完成之后,主要用在哪些地方,比較典型應用是語義搜索、智能問答、推薦系統等方面。知識圖譜是一個具有本體特征的語義網絡,可以看成是按照本體模式組織數據的知識庫,以知識圖譜為基礎進行搜索,可以根據查詢的內容進行語義搜索,查找需要找的本體或者本體的信息,這種語義搜索功能在google、百度、阿里巴巴等數據量大的公司里得到應用。智能問答,和語義搜索類似,對於提問內容,計算機首先要分析提問問題的語義,然后再將語義轉換為查詢語句,到知識圖譜中查找,將最貼近的答案提供給提問者。推薦系統首先要采集用戶的需求,分析用戶的以往數據,提取共同特征,然后根據一定的規則,對用戶提供推薦的產品。比如淘寶中記錄用戶經常購買的商品,經常瀏覽的商品,提取這些商品的共同特征,然后給這個用戶打上標簽,然后就給用戶推薦具有類似特征的商品。
知識圖譜主要反映的事物之間的關系,對於和關系鏈條有關的場景,也可以用知識圖譜解決,一些應用場景包括反欺詐、不一致性驗證、異常分析、客戶管理等


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM