元數據和數據元


 

由於最近在做主數據方面的項目,就去各論壇了解了一下有關主數據的姿勢。這次來記錄一下元數據和數據元的區別。

數據元(Data element):又稱數據類型,通過定義、標識、表示以及允許值等一系列屬性描述的數據單元。在特定的語義環境中被認為是不可再分的最小數據單元。

這個照我的理解啊,應該就是字段了。沒毛病。

元數據是關於數據的組織、數據域及其關系的信息,簡言之,元數據就是關於數據的數據。

列舉:

數據結構:數據集的名稱、關系、字段、約束等;數據集就暫且理解為一張表,(名稱、關系、字段、約束,可以理解為表的字段、外鍵關系和索引)
數據部署:數據集的物理位置;就暫且理解為存儲在磁盤上的物理路徑吧...
數據流:數據集之間的流程依賴關系(非參照依賴),包括數據集到另一個數據集的規則;
質量度量:數據集上可以計算的度量;
度量邏輯關系:數據集度量之間的邏輯運算關系;
ETL過程:過程運行的順序,並行、串行;
數據集快照:一個時間點上,數據在所有數據集上的分布情況;
星型模式元數據:事實表、維度、屬性、層次等;
報表語義層:報表指標的規則、過濾條件物理名稱和業務名稱的對應;
數據訪問日志:哪些數據何時被何人訪問;
質量稽核日志:何時、何度量被稽核,其結果;
數據裝載日志:哪些數據何時被何人裝載;

就上面這些東西在百科上找的,寫的比較抽象。以后在用的時候也許就能理解關於數據的數據這句話的含義了。


數據元一般來說由三部分組成:
a)對象類:思想、概念或真實世界中的事物的集合,它們具有清晰的邊界和含義,其特征和行為遵循同樣的規則。
b)特性:對象類中的所有成員共同具有的一個有別於其它的、顯著的特征。
c)表示:它描述了數據被表達的方式。
元數據(Metadata)是描述其它數據的數據(data about other data),或者說是用於提供某種資源的有關信息的結構數據(structured data)。元數據是描述信息資源或數據等對象的數據,其使用目的在於:識別資源;評價資源;追蹤資源在使用過程中的變化;實現簡單高效地管理大量網絡化數據;實現信息資源的有效發現、查找、一體化組織和對使用資源的有效管理。
元數據的基本特點主要有:
a)元數據一經建立,便可共享。元數據的結構和完整性依賴於信息資源的價值和使用環境;元數據的開發與利用環境往往是一個變化的分布式環境;任何一種格式都不可能完全滿足不同團體的不同需要;
b)元數據首先是一種編碼體系。元數據是用來描述數字化信息資源,特別是網絡信息資源的編碼體系,這導致了元數據和傳統數據編碼體系的根本區別;元數據的最為重要的特征和功能是為數字化信息資源建立一種機器可理解框架。 元數據體系構建了電子政務的邏輯框架和基本模型,從而決定了電子政務的功能特征、運行模式和系統運行的總體性能。電子政務的運作都基於元數據來實現。其主要作用有:描述功能、整合功能、控制功能和代理功能。 由於元數據也是數據,因此可以用類似數據的方法在數據庫中進行存儲和獲取。如果提供數據元的組織同時提供描述數據元的元數據,將會使數據元的使用變得准確而高效。用戶在使用數據時可以首先查看其元數據以便能夠獲取自己所需的信息。
摘自《GB/T 19488.1 電子政務數據元第1部分:設計和管理規范》

再說說兩者的區別吧

數據元是用來裝載數據的一個數據單元(字段)。
元數據是用來描述數據的數據,包括數據元。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM