什么是元數據
任何文件系統中的數據分為數據和元數據。數據是指普通文件中的實際數據,而元數據指用來描述一個文件的特征的系統數據,諸如訪問權限、文件擁有者以及文件數據塊的分布信息(inode...)等等。在集群文件系統中,分布信息包括文件在磁盤上的位置以及磁盤在集群中的位置。用戶需要操作一個文件必須首先得到它的元數據,才能定位到文件的位置並且得到文件的內容或相關屬性。
元數據管理方式
元數據管理有兩種方式。集中式管理和分布式管理。集中式管理是指在系統中有一個節點專門司職元數據管理,所有元數據都存儲在該節點的存儲設備上。所有客戶端對文件的請求前,都要先對該元數據管理器請求元數據。分布式管理是指將元數據存放在系統的任意節點並且能動態的遷移。對元數據管理的職責也分布到各個不同的節點上。大多數集群文件系統都采用集中式的元數據管理。因為集中式管理實現簡單,一致性維護容易,在一定的操作頻繁度內可以提供較滿意的性能。缺點是單一失效點問題,若該服務器失效,整個系統將無法正常工作。而且,當對元數據的操作過於頻繁時,集中的元數據管理成為整個系統的性能瓶頸。
分布式元數據管理的好處是解決了集中式管理的單一失效點問題, 而且性能不會隨着操作頻繁而出現瓶頸。其缺點是,實現復雜,一致性維護復雜,對性能有一定影響。