在Linux下我們在使用設備的時候,都會用到write這個函數,通過這個函數我們可以象使用文件那樣向設備傳送數據。可是為什么用戶使用write函數就可以把數據寫到設備里面去,這個過程到底是怎么實現的呢?
這個奧秘就在於設備驅動程序的write實現中,這里我結合一些源代碼來解釋如何使得一個簡簡單單的write函數能夠完成向設備里面寫數據的復雜過程。
這里的源代碼主要來自兩個地方。第一是oreilly出版的《Linux device driver》中的實例,第二是Linux Kernel 2.2.14核心源代碼。我只列出了其中相關部分的內容,如果讀者有興趣,也可以查閱其它源代碼。不過我不是在講解如何編寫設備驅動程序,所以不會對每一個細節都進行說明,再說有些地方我覺得自己還沒有吃透。
由於《Linux device driver》一書中的例子對於我們還是復雜了一些,我將其中的一個例程簡化了一下。這個驅動程序支持這樣一個設備:核心空間中的一個長度為10的數組kbuf[10]。我們可以通過用戶程序open它,read它,write它,close它。這個設備的名字我稱為short_t。
現在言歸正傳。 對於一個設備,它可以在/dev下面存在一個對應的邏輯設備節點,這個節點以文件的形式存在,但它不是普通意義上的文件,它是設備文件,更確切的說,它是設備節點。這個節點是通過mknod命令建立的,其中指定了主設備號和次設備號。主設備號表明了某一類設備,一般對應着確定的驅動程序;次設備號一般是區分是標明不同屬性,例如不同的使用方法,不同的位置,不同的操作。這個設備號是從/proc/devices文件中獲得的,所以一般是先有驅動程序在內核中,才有設備節點在目錄中。這個設備號(特指主設備號)的主要作用,就是聲明設備所使用的驅動程序。驅動程序和設備號是一一對應的,當你打開一個設備文件時,操作系統就已經知道這個設備所對應的驅動程序是哪一個了。這個"知道"的過程后面就講。
我們再說說驅動程序的基本結構吧。這里我只介紹動態模塊型驅動程序(就是我們使用insmod加載到核心中並使用rmmod卸載的那種),因為我只熟悉這種結構。模塊化的驅動程序由兩個函數是固定的:int init_module(void) ;void cleanup_module(void)。前者在insmod的時候執行,后者在rmmod的時候執行。 init_nodule在執行的時候,進行一些驅動程序初始化的工作,其中最主要的工作有三
件:注冊設備;申請I/O端口地址范圍;申請中斷IRQ。這里和我們想知道的事情相關的只
有注冊設備。
下面是一個典型的init_module函數:
int init_module(void){
int result = check_region(short_base,1);/* 察看端口地址*/
……
request_region(short_base,1,"short"); /* 申請端口地址*/
……
result = register_chrdev(short_major, "short", &short_fops); /* 注冊設備
*/
……
result = request_irq(short_irq, short_interrupt, SA_INTERRUPT, "short",
NULL); /* 申請IRQ */
……
return 0;
}/* init_module*/
上面這個函數我只保留了最重要的部分,其中最重要的函數是
result = register_chrdev(short_major, "short", &short_fops);
這是一個驅動程序的精髓所在!!當你執行indmod命令時,這個函數可以完成三件大事:第一,申請主設備號(short_major),或者指定,或者動態分配;第二,在內核中注冊設備的名字("short");第三,指定fops方法(&short_fops)。其中所指定的fops方法就是我們對設備進行操作的方法(例如read,write,seek,dir,open,release等),如何實現這些方法,是編寫設備驅動程序大部分工作量所在。
現在我們就要接觸關鍵部分了--如何實現fops方法。 我們都知道,每一個文件都有一個file的結構,在這個結構中有一個file_operations的結構體,這個結構體指明了能夠對該文件進行的操作。
下面是一個典型的file_operations結構:
struct file_operations {
loff_t (*llseek) (struct file *, loff_t, int);
ssize_t (*read) (struct file *, char *, size_t, loff_t *);
ssize_t (*write) (struct file *, const char *, size_t, loff_t *);
int (*readdir) (struct file *, void *, filldir_t);
unsigned int (*poll) (struct file *, struct poll_table_struct *);
int (*ioctl) (struct inode *, struct file *, unsigned int, unsigned long);
int (*mmap) (struct file *, struct vm_area_struct *);
int (*open) (struct inode *, struct file *);
int (*flush) (struct file *);
int (*release) (struct inode *, struct file *);
int (*fsync) (struct file *, struct dentry *);
int (*fasync) (int, struct file *, int);
int (*check_media_change) (kdev_t dev);
int (*revalidate) (kdev_t dev);
int (*lock) (struct file *, int, struct file_lock *);
};
我們可以看到它實際上就是許多文件操作的函數指針,其中就有write,其它的我們就不去管它了。這個write指針在實際的驅動程序中會以程序員所實現的函數名字出現,它指向程序員實現的設備write操作函數。下面就是一個實際的例子,這個write函數可以向核心內存的一個數組里輸入一個字符串。
int short_write (struct inode *inode, struct file *filp, const char *buf,
int count){
int retval = count;
extern unsigned char kbuf[10];
if(count>10)
count=10;
copy_from_user(kbuf, buf, count);
return retval;
}/* short_write */
設備short_t對應的fops方法是這樣聲明的:
struct file_operations short_fops = {
NULL, /* short_lseek */
short_read,
short_write,
NULL, /* short_readdir */
NULL, /* short_poll */
NULL, /* short_ioctl */
NULL, /* short_mmap */
short_open,
short_release,
NULL, /* short_fsync */
NULL, /* short_fasync */
/* nothing more, fill with NULLs */
};
其中NULL的項目就是不提供這個功能。所以我們可以看出short_t設備只提供了read,write,open,release功能。其中write功能我們在上面已經實現了,具體的實現函數起名為short_write。這些函數就是真正對設備進行操作的函數,這就是驅動程序的一大好處:不管你實現的時候是多么的復雜,但對用戶來看,就是那些常用的文件操作函數。
但是我們可以看到,驅動程序里的write函數有四個參數,函數格式如下:
short_write (struct inode *inode, struct file *filp, const char *buf, int count) 而用戶程序中的write函數只有三個參數,函數格式如下:
write(inf fd, char *buf, int count)
那他們兩個是怎么聯系在一起的呢?這就要靠操作系統核心中的函數sys_write了,下面
是Linux Kernel 2.2.14中sys_write中的源代碼:
asmlinkage ssize_t sys_write(unsigned int fd, const char * buf, size_t count)
{
ssize_t ret;
struct file * file;
struct inode * inode;
ssize_t (*write)(struct file *, const char *, size_t, loff_t *); /* 指向
驅動程序中的wirte函數的指針*/
lock_kernel();
ret = -EBADF;
file = fget(fd); /* 通過文件描述符得到文件指針 */
if (!file)
goto bad_file;
if (!(file->f_mode & FMODE_WRITE))
goto out;
inode = file->f_dentry->d_inode; /* 得到inode信息 */
ret = locks_verify_area(FLOCK_VERIFY_WRITE, inode, file, file->f_pos,
count);
if (ret)
goto out;
ret = -EINVAL;
if (!file->f_op || !(write = file->f_op->write)) /* 將函數開始時聲明的
write函數指針指向fops方法中對應的write函數 */
goto out;
down(&inode->i_sem);
ret = write(file, buf, count, &file->f_pos); /* 使用驅動程序中的write函數
將數據輸入設備,注意看,這里就是四個參數了 */
up(&inode->i_sem);
out:
fput(file);
bad_file:
unlock_kernel();
return ret;
}
我寫了一個簡單的程序來測試這個驅動程序,該程序源代碼節選如下(該省的我都省了):
main(){
int fd,count=0;
unsigned char buf[10];
fd=open("/dev/short_t",O_RDWR);
printf("input string:");
scanf("%s",buf);
count=strlen(buf);
if(count>10)
count=10;
count=write(fd,buf,count);
close(fd);
return 1;
}
現在我們就演示一下用戶使用write函數將數據寫到設備里面這個過程到底是怎么實現的:
1,insmod驅動程序。驅動程序申請設備名和主設備號,這些可以在/proc/devieces中獲得。
2,從/proc/devices中獲得主設備號,並使用mknod命令建立設備節點文件。這是通過主
設備號將設備節點文件和設備驅動程序聯系在一起。設備節點文件中的file屬性中指明了
驅動程序中fops方法實現的函數指針。
3,用戶程序使用open打開設備節點文件,這時操作系統內核知道該驅動程序工作了,就
調用fops方法中的open函數進行相應的工作。open方法一般返回的是文件標示符,實際
上並不是直接對它進行操作的,而是有操作系統的系統調用在背后工作。
4,當用戶使用write函數操作設備文件時,操作系統調用sys_write函數,該函數首先通
過文件標示符得到設備節點文件對應的inode指針和flip指針。inode指針中有設備號信
息,能夠告訴操作系統應該使用哪一個設備驅動程序,flip指針中有fops信息,可以告訴
操作系統相應的fops方法函數在那里可以找到。
5,然后這時sys_write才會調用驅動程序中的write方法來對設備進行寫的操作。
其中1-3都是在用戶空間進行的,4-5是在核心空間進行的。用戶的write函數和操作系統
的write函數通過系統調用sys_write聯系在了一起。
注意:
總的來說:設備文件通過設備號綁定了設備驅動,fops綁定了應用層的write和驅動層的write。當應用層寫一個設備文件的時候,系統找到對應的設備驅動,再通過fops找到對應的驅動write函數。