知識圖譜學習與實踐(6)——從結構化數據進行知識抽取(D2RQ介紹)


1 概述

D2RQ,含義是把關系型數據庫當作虛擬的RDF圖數據庫進行訪問。D2RQ平台是一個將關系型數據庫當作虛擬的、只讀的RDF圖數據庫進行訪問的系統。提供了基於RDF訪問關系數據庫的內容,而無需復制這個數據庫將其以RDF的形式進行保存。D2RQ有以下功能:

使用SPARQL查詢非RDF數據庫;

在Web上,將數據庫內容當作鏈接數據進行訪問;

以RDF形式創建一個自定義的數據庫,加載成RDF存儲;

使用Apache Jena API訪問非RDF數據庫的信息。

D2RQ是一個開源軟件,基於Apache協議發布,源代碼在Github上。

D2RQ平台的組成

l  D2RQ映射語言,一種聲明的映射語言,用於描述本體和關系數據模型之間的關系。

l  D2RA引擎,一種服務於Jena語義網工具庫插件,使用映射重寫對數據庫的SQL訪問的Jena API調用,並且將查詢結果傳遞給框架高層。

l  D2R服務器,一個提供調試用的鏈接數據視圖和HTML視圖的HTTP服務器,還提供了一個SPARQL協議endpoint數據接口。

 

 

2 D2RQ映射語言

D2RQ是一種聲明式語言,描述了關系型數據庫規則和RDFS詞匯或OWL本體之間的關系。D2RQ本身是一個符合Trutle語法的RDF文檔,映射是用在D2RQ命名空間下的術語表示的,D2RQ命名空間是

http://www.wiwiss.fu-berlin.de/suhl/bizer/D2RQ/0.1#

映射定義了一個虛擬RDF圖,包括數據庫的信息。和SQL視圖概念類似,除了虛擬的數據結構是一個RDF圖而不是虛擬的關系表。這個虛擬的RDF圖能夠以多種方式訪問,取決於映射的實現形式。D2RQ平台提供了SPARQL訪問,一個鏈接數據服務器,一個RDF數據集生成器,一個簡單的HTML界面和Jena API訪問D2RQ映射數據庫。

下圖顯示了一個D2RQ映射實例的結構

 

 

數據庫映射為RDF術語,顯示在右側的,使用d2rq:ClassMaps and d2rq:PropertyBridges。映射中最重要的問題是類的映射,一個類映射表示一個類或者一組相似的本體類。類映射描述了類的實例如何生成URI或者空節點。它還有一組屬性映射規則,能夠描述實例的屬性如何創建。

3 D2R服務器

D2R服務器是一個工具,基於語義網發布關系型數據庫的內容,所有的信息都是由鏈接數據組成。語義網上的數據都是用RDF模型化和表示,D2R服務器使用了一個定制化D2RQ映射將數據庫內容轉換為RDF的形式,允許以RDF數據瀏覽和搜索,這是語義網中最主要的兩種訪問數據的方式。

網絡的請求通過映射重寫為SQL查詢語句,這種即時轉換允許從大型實時數據庫發布RDF,並且無需將數據復制到專用的RDF三元組存儲中。

4 結語

非常簡要的介紹了D2RQ的內容,實際的使用過程中,應該更深入的參考http://d2rq.org/的相關內容。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM