本體是對領域實體存在本質的抽象,他強調實體間的關聯,並通過多種知識表示元素將這些關聯表達和反映出來,這些知識表示元素也被稱為元本體,主要包括:
- 概念——表示領域知識元,包括一般意義上的概念以及任務、功能、策略、行為、過程等,在本體的實現中,概念通常用類(class)來定義,而且通常具有一定的分類層次關系;
- 屬性——描述概念的性質,是一個概念區別於其他概念的特征,通常用槽(slot)或者類的屬性(Properties)來定義;
- 關系——表示概念之間的關聯,例如一些常用的關聯:父關系、子關系、相等關系;
- 函數——表示一類特殊的關系,即由前n-1個要素來唯一決定第n個要素,如:長方形的長和寬唯一決定其面積;
- 公理——表示永真式,在本體論中,對於屬性、關系和函數都具有一定的關聯和約束,這些約束就是公理,公理一般用槽的側面(facet)來定義;
- 實例——表示某個概念類的具體實體。
本體的每一個知識表示元素也可以被看作一個知識片,每一個知識片都包含名稱、定義和文檔說明。
總的來說,構造本體的目的都是為了實現某種程度的知識共享和重用。從廣義來講,本體的作用主要有以下兩方面:
- 本體的分析澄清了領域知識的結構,從而為知識表示打好基礎。本體可以重用,從而避免重復的領域知識分析;
- 統一的術語和概念使知識共享成為可能。
較為具體來講,本體的作用包括三個方面:即交流(communication)、互操作(inter-operability)和系統工程(system engineering):
- 交流:主要為人與人之間或組織與組織之間的交流提供共同的詞匯;
- 互操作:在不同的建模方式、范式、語言和軟件工具之間進行翻譯和映射,以實現不同系統之間的互操作和集成;
- 系統工程:本體分析能夠為系統工程提供以下方面的好處:重用(reusability):本體是領域內重要實體、屬性、工程及其相互關系形式化描述的基礎。這種形式化描述可成為軟件系統中可重用和共享的組件;知識獲取(knowledge acquisition):當構造基於知識的系統時,用已有的本體作為起點和基礎來指導知識的獲取,可以提高其速度和可靠性;可靠性(reliabililty):形式化的表達使得自動的一致性檢查成為可能,從而提高了軟件的可靠性:規范描述(specification):本體分析有助於確定IT系統(如知識庫)的需求和規范。
本體作為一種知識表示方法,與謂詞邏輯、框架等其他方法的區別在於他們屬於不同層次的知識表示方法,本體表達了概念的結構、概念之間的關系等領域中實體的固有特征,即“共享概念化”,而其他的知識表示方法如語義網絡等,可以表達某個體對實體的認識,不一定是實體的固有特征。這正是本體層與其它層的知識表示方法的本質區別。
知識工程師將本體概念引入知識工程,詳細說明模型中涵蓋的概念。實例、關系和公理等實體,並以此建立本體。通過使用元屬性對屬性進行分析,並對屬性提出了一種針對本體建模概念化分析的形式化方法,解決了知識共享中的一些問題,有效地促進了來自不同領域的研究人員和組織間的交流。顯而易見,基於本體的知識表示法在知識表示方面有很大的潛力。
