struct _file_operations
struct _file_operations在Fs.h這個文件里面被定義的,如下所示:
struct file_operations { struct module *owner;//擁有該結構的模塊的指針,一般為THIS_MODULES loff_t (*llseek) (struct file *, loff_t, int);//用來修改文件當前的讀寫位置 ssize_t (*read) (struct file *, char __user *, size_t, loff_t *);//從設備中同步讀取數據
ssize_t (*write) (struct file *, const char __user *, size_t, loff_t *);//向設備發送數據 ssize_t (*aio_read) (struct kiocb *, const struct iovec *, unsigned long, loff_t);//初始化一個異步的讀取操作 ssize_t (*aio_write) (struct kiocb *, const struct iovec *, unsigned long, loff_t);//初始化一個異步的寫入操作 int (*readdir) (struct file *, void *, filldir_t);//僅用於讀取目錄,對於設備文件,該字段為NULL unsigned int (*poll) (struct file *, struct poll_table_struct *); //輪詢函數,判斷目前是否可以進行非阻塞的讀寫或寫入 int (*ioctl) (struct inode *, struct file *, unsigned int, unsigned long); //執行設備I/O控制命令 long (*unlocked_ioctl) (struct file *, unsigned int, unsigned long); //不使用BLK文件系統,將使用此種函數指針代替ioctl long (*compat_ioctl) (struct file *, unsigned int, unsigned long); //在64位系統上,32位的ioctl調用將使用此函數指針代替 int (*mmap) (struct file *, struct vm_area_struct *); //用於請求將設備內存映射到進程地址空間 int (*open) (struct inode *, struct file *); //打開 int (*flush) (struct file *, fl_owner_t id); int (*release) (struct inode *, struct file *); //關閉 int (*fsync) (struct file *, struct dentry *, int datasync); //刷新待處理的數據 int (*aio_fsync) (struct kiocb *, int datasync); //異步刷新待處理的數據 int (*fasync) (int, struct file *, int); //通知設備FASYNC標志發生變化 int (*lock) (struct file *, int, struct file_lock *); ssize_t (*sendpage) (struct file *, struct page *, int, size_t, loff_t *, int); unsigned long (*get_unmapped_area)(struct file *, unsigned long, unsigned long, unsigned long, unsigned long); int (*check_flags)(int); int (*flock) (struct file *, int, struct file_lock *); ssize_t (*splice_write)(struct pipe_inode_info *, struct file *, loff_t *, size_t, unsigned int); ssize_t (*splice_read)(struct file *, loff_t *, struct pipe_inode_info *, size_t, unsigned int); int (*setlease)(struct file *, long, struct file_lock **); };
Linux使用file_operations結構訪問驅動程序的函數,這個結構的每一個成員的名字都對應着一個調用。
用戶進程利用在對設備文件進行諸如read/write操作的時候,系統調用通過設備文件的主設備號找到相應的設備驅動程序,然后讀取這個數據結構相應的函數指針,接着把控制權交給該函數,這是Linux的設備驅動程序工作的基本原理。
下面是各成員解析:
1、struct module *owner
第一個 file_operations 成員根本不是一個操作,它是一個指向擁有這個結構的模塊的指針。
這個成員用來在它的操作還在被使用時阻止模塊被卸載. 幾乎所有時間中, 它被簡單初始化為 THIS_MODULE, 一個在 <linux/module.h> 中定義的宏.這個宏比較復雜,在進行簡單學習操作的時候,一般初始化為THIS_MODULE。
2、loff_t (*llseek) (struct file * filp , loff_t p, int orig);
(指針參數filp為進行讀取信息的目標文件結構體指針;參數 p 為文件定位的目標偏移量;參數orig為對文件定位的起始地址,這個值可以為文件開頭(SEEK_SET,0,當前位置(SEEK_CUR,1),文件末尾(SEEK_END,2))
llseek 方法用作改變文件中的當前讀/寫位置, 並且新位置作為(正的)返回值.
loff_t 參數是一個"long offset", 並且就算在 32位平台上也至少 64 位寬. 錯誤由一個負返回值指示;如果這個函數指針是 NULL, seek 調用會以潛在地無法預知的方式修改 file 結構中的位置計數器( 在"file 結構" 一節中描述).
3、ssize_t (*read) (struct file * filp, char __user * buffer, size_t size , loff_t * p);
(指針參數 filp 為進行讀取信息的目標文件,指針參數buffer 為對應放置信息的緩沖區(即用戶空間內存地址),參數size為要讀取的信息長度,參數 p 為讀的位置相對於文件開頭的偏移,在讀取信息后,這個指針一般都會移動,移動的值為要讀取信息的長度值)
這個函數用來從設備中獲取數據。在這個位置的一個空指針導致 read 系統調用以 -EINVAL("Invalid argument") 失敗。一個非負返回值代表了成功讀取的字節數( 返回值是一個 "signed size" 類型, 常常是目標平台本地的整數類型).
4、ssize_t (*aio_read)(struct kiocb * , char __user * buffer, size_t size , loff_t p);
可以看出,這個函數的第一、三個參數和本結構體中的read()函數的第一、三個參數是不同 的,異步讀寫的第三個參數直接傳遞值,而同步讀寫的第三個參數傳遞的是指針,因為AIO從來不需要改變文件的位置。異步讀寫的第一個參數為指向kiocb結構體的指針,而同步讀寫的第一參數為指向file結構體的指針,每一個I/O請求都對應一個kiocb結構體);初始化一個異步讀 -- 可能在函數返回前不結束的讀操作.如果這個方法是 NULL, 所有的操作會由 read 代替進行(同步地).(有關linux異步I/O,可以參考有關的資料,《linux設備驅動開發詳解》中給出了詳細的解答)
5、ssize_t (*write) (struct file * filp, const char __user * buffer, size_t count, loff_t * ppos);
(參數filp為目標文件結構體指針,buffer為要寫入文件的信息緩沖區,count為要寫入信息的長度,ppos為當前的偏移位置,這個值通常是用來判斷寫文件是否越界)
發送數據給設備.。如果 NULL, -EINVAL 返回給調用 write 系統調用的程序. 如果非負, 返回值代表成功寫的字節數。
(注:這個操作和上面的對文件進行讀的操作均為阻塞操作)
6、ssize_t (*aio_write)(struct kiocb *, const char __user * buffer, size_t count, loff_t * ppos);
初始化設備上的一個異步寫.參數類型同aio_read()函數;
7、int (*readdir) (struct file * filp, void *, filldir_t);
對於設備文件這個成員應當為 NULL; 它用來讀取目錄, 並且僅對文件系統有用.
8、unsigned int (*poll) (struct file *, struct poll_table_struct *);
(這是一個設備驅動中的輪詢函數,第一個參數為file結構指針,第二個為輪詢表指針)
這個函數返回設備資源的可獲取狀態,即POLLIN,POLLOUT,POLLPRI,POLLERR,POLLNVAL等宏的位“或”結果。每個宏都表明設備的一種狀態,如:POLLIN(定義為0x0001)意味着設備可以無阻塞的讀,POLLOUT(定義為0x0004)意味着設備可以無阻塞的寫。
(poll 方法是 3 個系統調用的后端: poll, epoll, 和 select, 都用作查詢對一個或多個文件描述符的讀或寫是否會阻塞.poll 方法應當返回一個位掩碼指示是否非阻塞的讀或寫是可能的, 並且, 可能地, 提供給內核信息用來使調用進程睡眠直到 I/O 變為可能. 如果一個驅動的 poll 方法為 NULL, 設備假定為不阻塞地可讀可寫.
(這里通常將設備看作一個文件進行相關的操作,而輪詢操作的取值直接關系到設備的響應情況,可以是阻塞操作結果,同時也可以是非阻塞操作結果)
9、int (*ioctl) (struct inode *inode, struct file *filp, unsigned int cmd, unsigned long arg);
(inode 和 filp 指針是對應應用程序傳遞的文件描述符 fd 的值, 和傳遞給 open 方法的相同參數.cmd 參數從用戶那里不改變地傳下來, 並且可選的參數 arg 參數以一個 unsigned long 的形式傳遞, 不管它是否由用戶給定為一個整數或一個指針.如果調用程序不傳遞第 3 個參數, 被驅動操作收到的 arg 值是無定義的.因為類型檢查在這個額外參數上被關閉, 編譯器不能警告你如果一個無效的參數被傳遞給 ioctl, 並且任何關聯的錯誤將難以查找.)
ioctl 系統調用提供了發出設備特定命令的方法(例如格式化軟盤的一個磁道, 這不是讀也不是寫). 另外, 幾個 ioctl 命令被內核識別而不必引用 fops 表.如果設備不提供 ioctl 方法, 對於任何未事先定義的請求(-ENOTTY, "設備無這樣的 ioctl"), 系統調用返回一個錯誤.
10、int (*mmap) (struct file *, struct vm_area_struct *);
mmap 用來請求將設備內存映射到進程的地址空間。 如果這個方法是 NULL, mmap 系統調用返回 -ENODEV.
(如果想對這個函數有個徹底的了解,那么請看有關“進程地址空間”介紹的書籍)
11、int (*open) (struct inode * inode , struct file * filp ) ;
(inode 為文件節點,這個節點只有一個,無論用戶打開多少個文件,都只是對應着一個inode結構;但是filp就不同,只要打開一個文件,就對應着一個file結構體,file結構體通常用來追蹤文件在運行時的狀態信息)
盡管這常常是對設備文件進行的第一個操作, 不要求驅動聲明一個對應的方法. 如果這個項是 NULL, 設備打開一直成功, 但是你的驅動不會得到通知.與open()函數對應的是release()函數。
12、int (*flush) (struct file *);
flush 操作在進程關閉它的設備文件描述符的拷貝時調用;
它應當執行(並且等待)設備的任何未完成的操作.這個必須不要和用戶查詢請求的 fsync 操作混淆了. 當前, flush 在很少驅動中使用;SCSI 磁帶驅動使用它, 例如, 為確保所有寫的數據在設備關閉前寫到磁帶上. 如果 flush 為 NULL, 內核簡單地忽略用戶應用程序的請求.
13、int (*release) (struct inode *, struct file *);
release ()函數當最后一個打開設備的用戶進程執行close()系統調用的時候,內核將調用驅動程序release()函數:
void release(struct inode inode,struct file *file),release函數的主要任務是清理未結束的輸入輸出操作,釋放資源,用戶自定義排他標志的復位等。在文件結構被釋放時引用這個操作. 如同 open, release 可以為 NULL.
14、int(*synch)(struct file *,struct dentry *,int datasync);
刷新待處理的數據,允許進程把所有的臟緩沖區刷新到磁盤。
15、int (*aio_fsync)(struct kiocb *, int);
這是 fsync 方法的異步版本.所謂的fsync方法是一個系統調用函數。系統調用fsync把文件所指定的文件的所有臟緩沖區寫到磁盤中(如果需要,還包括存有索引節點的緩沖區)。相應的服務例程獲得文件對象的地址,並隨后調用fsync方法。通常這個方法以調用函數__writeback_single_inode()結束,這個函數把與被選中的索引節點相關的臟頁和索引節點本身都寫回磁盤
16、int (*fasync) (int, struct file *, int);
這個函數是系統支持異步通知的設備驅動,下面是這個函數的模板:
static int ***_fasync(int fd,struct file *filp,int mode)
{
struct ***_dev * dev=filp->private_data;
return fasync_helper(fd,filp,mode,&dev->async_queue);//第四個參數為 fasync_struct結構體指針的指針。
//這個函數是用來處理FASYNC標志的函數。(FASYNC:表示兼容BSD的fcntl同步操作)當這個標志改變時,驅動程序中的fasync()函數將得到執行。 (注:感覺這個‘標志'詞用的並不恰當)
}
此操作用來通知設備它的 FASYNC 標志的改變. 異步通知是一個高級的主題, 在第 6 章中描述.這個成員可以是NULL 如果驅動不支持異步通知.
17、int (*lock) (struct file *, int, struct file_lock *);
lock 方法用來實現文件加鎖; 加鎖對常規文件是必不可少的特性, 但是設備驅動幾乎從不實現它.
18、ssize_t (*readv) (struct file *, const struct iovec *, unsigned long, loff_t *);
ssize_t (*writev) (struct file *, const struct iovec *, unsigned long, loff_t *);
這些方法實現發散/匯聚讀和寫操作. 應用程序偶爾需要做一個包含多個內存區的單個讀或寫操作;這些系統調用允許它們這樣做而不必對數據進行額外拷貝. 如果這些函數指針為 NULL, read 和 write 方法被調用( 可能多於一次 ).
19、ssize_t (*sendfile)(struct file *, loff_t *, size_t, read_actor_t, void *);
這個方法實現 sendfile 系統調用的讀, 使用最少的拷貝從一個文件描述符搬移數據到另一個.
例如, 它被一個需要發送文件內容到一個網絡連接的 web 服務器使用. 設備驅動常常使 sendfile 為 NULL.
20、ssize_t (*sendpage) (struct file *, struct page *, int, size_t, loff_t *, int);
sendpage 是 sendfile 的另一半; 它由內核調用來發送數據, 一次一頁, 到對應的文件. 設備驅動實際上不實現 sendpage.
21、unsigned long (*get_unmapped_area)(struct file *, unsigned long, unsigned long, unsigned long, unsigned long);
這個方法的目的是在進程的地址空間找一個合適的位置來映射在底層設備上的內存段中。這個任務通常由內存管理代碼進行; 這個方法存在為了使驅動能強制特殊設備可能有的任何的對齊請求. 大部分驅動可以置這個方法為 NULL.[10]
22、int (*check_flags)(int)
這個方法允許模塊檢查傳遞給 fnctl(F_SETFL...) 調用的標志.
23、int (*dir_notify)(struct file *, unsigned long);
這個方法在應用程序使用 fcntl 來請求目錄改變通知時調用. 只對文件系統有用; 驅動不需要實現 dir_notify.