總結:
VFS只存在於內存中,它在系統啟動時被創建,系統關閉時注銷。
VFS的作用就是屏蔽各類文件系統的差異,給用戶、應用程序、甚至Linux其他管理模塊提供統一的接口集合。
管理VFS數據結構的組成部分主要包括超級塊和inode。
VFS是物理文件系統與服務之間的一個接口層,它對Linux的每個文件系統的所有細節進行抽象,使得不同的文件系統在Linux核心以及系統中運行的進程看來都是相同的。
嚴格的說,VFS並不是一種實際的文件系統。它只存在於內存中,不存在於任何外存空間。VFS在系統啟動時建立,在系統關閉時消亡。
VFS使Linux同時安裝、支持許多不同類型的文件系統成為可能。VFS擁有關於各種特殊文件系統的公共界面,當某個進程發布了一個面向文件的系統調用時,內核將調用VFS中對應的函數,這個函數處理一些與物理結構無關的操作,並且把它重定向為真實文件系統中相應的函數調用,后者用來處理那些與物理結構相關的操作。
下圖就是邏輯上對VFS及其下層實際文件系統的組織圖,可以看到用戶層只能於VFS打交道,而不能直接訪問實際的文件系統,比如EXT2、EXT3、PROC,換句話說,
就是用戶層不用也不能區別對待這些真正的文件系統,不過,SOCKET雖然也屬於VFS的管轄范圍,但是有其特殊性,
就是不能像打開大部分文件系統下的“文件”一樣打開socket,它只能被創建,而且內核中對其有特殊性處理。
VFS描述文件系統使用超級塊和inode 的方式,所謂超級塊就是對所有文件系統的管理機構,每種文件系統都要把自己的信息掛到super_blocks這么一個全局鏈表上。
內核中是分成2個步驟完成:首先每個文件系統必須通過register_filesystem函數將自己的file_system_type掛接到file_systems這個全局變量上,
然后調用kern_mount函數把自己的文件相關操作函數集合表掛到super_blocks上。每種文件系統類型的讀超級塊的例程(get_sb)必須由自己實現。
文件系統由子目錄和文件構成。每個子目錄和文件只能由唯一的inode 描述。inode 是Linux管理文件系統的最基本單位,也是文件系統連接任何子目錄、文件的橋梁。
VFS inode的內容取自物理設備上的文件系統,由文件系統指定的操作函數(i_op 屬性指定)填寫。VFS inode只存在於內存中,可通過inode緩存訪問。
1、super_block
- 相關的數據結構為:
struct super_block{struct list_head s_list;/* Keep this first */// 連接super_block的鏈表dev_t s_dev;/* search index; _not_ kdev_t */unsignedlong s_blocksize;unsignedlong s_old_blocksize;unsignedchar s_blocksize_bits;unsignedchar s_dirt;unsignedlonglong s_maxbytes;/* Max file size */struct file_system_type *s_type;// 所表示的文件系統的類型struct super_operations *s_op;// 文件相關操作函數集合表struct dquot_operations *dq_op;//struct quotactl_ops *s_qcop;//struct export_operations *s_export_op;//unsignedlong s_flags;//unsignedlong s_magic;//struct dentry *s_root;// Linux文件系統中某個索引節點(inode)的鏈接struct rw_semaphore s_umount;//struct semaphore s_lock;//int s_count;//int s_syncing;//int s_need_sync_fs;//atomic_t s_active;//void*s_security;//struct xattr_handler **s_xattr;//struct list_head s_inodes;/* all inodes */// 鏈接文件系統的inodestruct list_head s_dirty;/* dirty inodes */struct list_head s_io;/* parked for writeback */struct hlist_head s_anon;/* anonymous dentries for (nfs) exporting */struct list_head s_files;// 對於每一個打開的文件,由file對象來表示。鏈接文件系統中filestruct block_device *s_bdev;//struct list_head s_instances;//struct quota_info s_dquot;/* Diskquota specific options */int s_frozen;//wait_queue_head_t s_wait_unfrozen;//char s_id[32];/* Informational name */void*s_fs_info;/* Filesystem private info *//*** The next field is for VFS *only*. No filesystems have any business* even looking at it. You had been warned.*/struct semaphore s_vfs_rename_sem;/* Kludge *//* Granuality of c/m/atime in ns.Cannot be worse than a second */u32 s_time_gran;};
- super_block存在於兩個鏈表中,一個是系統所有super_block的鏈表, 一個是對於特定的文件系統的super_block鏈表.
所有的super_block都存在於 super_blocks(VFS管理層) 鏈表中:
- 對於特定的文件系統(文件系統層的具體文件系統), 該文件系統的所有的super_block 都存在於file_sytem_type中的fs_supers鏈表中.
int register_filesystem(struct file_system_type * fs)
2、inode
通常,文件系統磁盤空間中大約百分之一空間分配給了 inode 表。
相關的數據結構為:
/** Keep mostly read-only and often accessed (especially for* the RCU path lookup and 'stat' data) fields at the beginning* of the 'struct inode'*/struct inode{umode_t i_mode;unsignedshort i_opflags;kuid_t i_uid;kgid_t i_gid;unsignedint i_flags;#ifdef CONFIG_FS_POSIX_ACLstruct posix_acl *i_acl;struct posix_acl *i_default_acl;#endifconststruct inode_operations *i_op;struct super_block *i_sb;struct address_space *i_mapping;#ifdef CONFIG_SECURITYvoid*i_security;#endif/* Stat data, not accessed from path walking */unsignedlong i_ino;/** Filesystems may only read i_nlink directly. They shall use the* following functions for modification:** (set|clear|inc|drop)_nlink* inode_(inc|dec)_link_count*/union{constunsignedint i_nlink;unsignedint __i_nlink;};dev_t i_rdev;loff_t i_size;struct timespec i_atime;struct timespec i_mtime;struct timespec i_ctime;spinlock_t i_lock;/* i_blocks, i_bytes, maybe i_size */unsignedshort i_bytes;unsignedint i_blkbits;blkcnt_t i_blocks;#ifdef __NEED_I_SIZE_ORDEREDseqcount_t i_size_seqcount;#endif/* Misc */unsignedlong i_state;struct mutex i_mutex;unsignedlong dirtied_when;/* jiffies of first dirtying */unsignedlong dirtied_time_when;struct hlist_node i_hash;struct list_head i_wb_list;/* backing dev IO list */struct list_head i_lru;/* inode LRU list */struct list_head i_sb_list;union{struct hlist_head i_dentry;struct rcu_head i_rcu;};u64 i_version;atomic_t i_count;atomic_t i_dio_count;atomic_t i_writecount;#ifdef CONFIG_IMAatomic_t i_readcount;/* struct files open RO */#endifconststruct file_operations *i_fop;/* former ->i_op->default_file_ops */struct file_lock_context *i_flctx;struct address_space i_data;struct list_head i_devices;union{struct pipe_inode_info *i_pipe;struct block_device *i_bdev;struct cdev *i_cdev;};__u32 i_generation;#ifdef CONFIG_FSNOTIFY__u32 i_fsnotify_mask;/* all events this inode cares about */struct hlist_head i_fsnotify_marks;#endifvoid*i_private;/* fs or device private pointer */};
inode存在於兩個雙向鏈表中:
一個是inode所在文件系統的super_block的 s_inodes 鏈表中
一個是根據inode的使用狀態存在於以下三個鏈表中的某個鏈表中:
一個是inode所在文件系統的super_block的 s_inodes 鏈表中
一個是根據inode的使用狀態存在於以下三個鏈表中的某個鏈表中:
- 未用的: inode_unused 鏈表
- 正在使用的: inode_in_use 鏈表
- 臟的: super block中的s_dirty 鏈表
3、
dentry
struct dentry{/* RCU lookup touched fields */unsignedint d_flags;/* protected by d_lock */seqcount_t d_seq;/* per dentry seqlock */struct hlist_bl_node d_hash;/* lookup hash list */struct dentry *d_parent;/* parent directory */struct qstr d_name;struct inode *d_inode;/* Where the name belongs to - NULL is* negative */unsignedchar d_iname[DNAME_INLINE_LEN];/* small names *//* Ref lookup also touches following */struct lockref d_lockref;/* per-dentry lock and refcount */conststruct dentry_operations *d_op;struct super_block *d_sb;/* The root of the dentry tree */unsignedlong d_time;/* used by d_revalidate */void*d_fsdata;/* fs-specific data */struct list_head d_lru;/* LRU list */struct list_head d_child;/* child of parent list */struct list_head d_subdirs;/* our children *//** d_alias and d_rcu can share memory*/union{struct hlist_node d_alias;/* inode alias list */struct rcu_head d_rcu;} d_u;};
dentry對象存在於三個雙向鏈表中:
- 所有未用的目錄項: dentry_unused 鏈表
- 正在使用的目錄項: 對應inode的 i_dentry 鏈表
- 表示父子目錄結構的鏈表
