元數據就是關於數據的數據(data about data),主要是描述數據屬性(property)的信息,用來支持如指示存儲位置、歷史數據、資源查找、文件記錄等功能。
要理解元數據,首先要知道“元”是什么。元(meta),一般被翻譯成“關於……的……”。
事實上,這個前綴來源於希臘文,表示“在……之后”,在某樣事情結束之后,就含有了“歸納”、“總結”的意思,因此,元就代表着“本原”、“體系”的意思。
元數據是指從信息資源中抽取出來的用於說明其特征、內容的,結構化的數據(如題名,版本、出版數據、相關說明,包括檢索點等),用於組織、描述、檢索、保存、管理信息和知識資源。
一個基本的元數據由元數據項目和元數據內容構成。
利用元數據來描述資源后,我們就可以用來做很多的事情。比如確定資源,為資源提供檢索點,在不同系統之間進行數據交換。
可是,我們每個人都可以對資源進行描述,取的名字(元數據項目)和值(元數據內容)會千奇百怪怎么辦呢?因此,就有了元數據標准。
元數據標准包括元數據結構標准(即元數據包含那些項目,都柏林核心集,MARC元素集)、元數據內容標准、元數據取值標准、元數據編碼標准(用於機讀記錄的存儲和交換,比如MARC(Machine Readable Cataloging), XML)
互聯網發展的越來越快,元數據的格式越來越多,人們對它的互操作要求也越來越高,就出現了XML!在利用XML描述一個文檔的時候,我們可以自己定義標簽,如”<title>”。這些小標簽都是元數據。
最后來看一下XML的好朋友HTML。HTML的head里有一個meta標簽。它是什么呢?根據上面的解釋,我們應該知道它是“關於文檔的信息”了
meta的屬性有兩種,name和http-equiv.
-------name屬性用來描述網頁的內容,以便搜索引擎查找。比如這個網頁的keywords。
-------http-equiv屬性指示服務器在發送實際的文檔之前先在要傳送給瀏覽器的 MIME 文檔頭部包含名稱/值對。
比如:
<meta http-equiv="Content-Language" contect="zh-CN">
用以說明主頁制作所使用的文字以及語言