元數據簡介


一、元數據(Meta Data)

1、元數據定義

元數據是指描述數據的數據,通常由信息結構的描述組成,隨着技術的發展元數據內涵有了非常大的擴展,比如 UML 模型、數據交易規則、用 Java,.NET,C++等編寫的APIs、業務流程和工作流模型、產品配置描述和調優參數以及各種業務規則、術語和定義等。
在大數據時代,元數據還應該包括對各種新數據類型的描述,如對位置、名字、用戶點擊次數、音頻、視頻、圖片、各種無線感知設備數據和各種監控設備數據等的描述等。

2、元數據分類

元數據通常分為業務元數據、技術元數據和操作元數據等。

  • 業務元數據:主要包括業務規則、定義、術語、術語表、運算法則和系統使用業務語言等,主要使用者是業務用戶。
  • 技術元數據:主要用來定義信息供應鏈(Information Supply Chain,ISC)各類組成部分元數據結構,具體包括各個系統表和字段結構、屬性、出處、依賴性等,以及存儲過程、函數、序列等各種對象。
  • 操作元數據:是指應用程序運行信息,比如其頻率、記錄數以及各個組件的分析和其它統計信息等。

從整個企業層面來說,各種工具軟件和應用程序越來越復雜,相互依存度逐年增加,相應的追蹤整個信息供應鏈各組件之間數據流動、了解數據元素含義和上下文的需求越來越強烈。

3、元數據集成體系結構

各個企業的元數據管理策略和元數據管理成熟度差別較大,因此元數據集成體系結構也多種多樣。大體上元數據集成體系結構可以分為:

  • 點對點的元數據集成體系結構;
  • 中央輻射式元數據體系結構;
  • 基於 CWM(Common Warehouse MetaModel,公共倉庫元模型)模型驅動的點對點元數據集成體系結構;
  • 基於 CWM 模型驅動的中央存儲庫元數據集成體系結構;
  • 分布式(聯邦式)元數據集成體系結構;
  • 層次/星型元數據集成體系結構;

二、元模型(Metamodel)

1、元模型定義

模型(Model)是用來描述特定的系統、過程、事物或概念的准確而抽象的表示。本質上來說,元數據是數據的形式化模型,是數據的抽象描述,該描述准確地描述了數據。
元模型(Metamodel)也就是模型的模型(或者元-元數據),是用來描述元數據的模型。

2、以“關系型表實體-關系(ER)模型”舉例說明:

1)一個簡單的關系型表元模型:描述了如何定義一個關系型表,例如

  • 每個表必須有一個名字(字符串)
  • 一個表可以有一個簡單的關系型表元模型描述了如何定義一個關系型表
  • 每個表必須有一個名字(字符串)
  • 一個表可以有 1 到多個列
  • 每個列必須有一個名字(字符串)和數據類型(字符串)


2)如果要創建一個關系型表模型,基於該表元模型創建一個實例即可:

  • 創建一個常見的雇員表 Employees 表模型,Employees 表包含 6 個列,分別是編號、姓、名字、部門編號、經理編號和職位編號
  • 另一個實例 department 表模型。department 表包含 2 個列,分別是編號和部門名稱

三、元-元模型(Meta-meta model)

1、元-元模型定義

元-元模型就是元模型的模型,有時也被稱為本體(ontology),是模型驅動的元數據集成體系結構的基礎,其定義了描述元模型的語言,規定元模型必須依照一定的形式化規則來建立,以便所有的軟件工具都能夠對其進行理解。

2、元數據層次結構

元-元模型比元模型具有更高的抽象級別,一個元模型是一個元-元模型的實例,元模型比元-元模型更加精細,而元-元模型比元模型更加抽象。元數據(模型)則是一個元模型的實例,遵守元模型的規定和約束。用戶對象(或用戶數據)則是元數據(或者稱為模型)的實例。
元數據層次結構分為 4 層,

  • L3 是元-元模型:元類、元屬性、元操作
  • L2 元模型:類、屬性、操作、構件
  • L1 模型/元數據:實體-關系(ER)圖
  • L0 用戶對象/用戶數據:交易數據、ODS 數據、數據倉庫數據、數據集市數據、數據中心數據等

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM