在linux內核中讀寫文件


http://blog.csdn.net/tommy_wxie/article/details/8194276

 

1. 序曲

在用戶態,讀寫文件可以通過read和write這兩個系統調用來完成(C庫函數實際上是對系統調用的封裝)。 但是,在內核態沒有這樣的系統調用,我們又該如何讀寫文件呢?

閱讀Linux內核源碼,可以知道陷入內核執行的是實際執行的是sys_read和sys_write這兩個函數,但是這兩個函數沒有使用EXPORT_SYMBOL導出,也就是說其他模塊不能使用。

在fs/open.c中系統調用具體實現如下(內核版本2.6.34.1):

SYSCALL_DEFINE3(open, const char __user *, filename, int, flags, int, mode)
{
       long ret;

if (force_o_largefile()) flags |= O_LARGEFILE; ret = do_sys_open(AT_FDCWD, filename, flags, mode); /* avoid REGPARM breakage on x86: */ asmlinkage_protect(3, ret, filename, flags, mode); return ret; }

跟蹤do_sys_open()函數,就會發現它主要使用了do_filp_open()函數該函數在fs/namei.c中,而在該文件中,filp_open函數也是調用了do_filp_open函數,並且接口和sys_open函數極為相似,調用參數也和sys_open一樣,並且使用EXPORT_SYMBOL導出了,所以我們猜想該函數可以打開文件,功能和open一樣。

使用同樣的方法,找出了一組在內核操作文件的函數,如下:

功能

函數原型

打開文件

struct file *filp_open(const char *filename, int flags, int mode)

讀文件

ssize_t vfs_read(struct file *file, char __user *buf, size_t count, loff_t *pos)

寫文件

ssize_t vfs_write(struct file *file, const char __user *buf, size_t count, loff_t *pos)

關閉文件

int filp_close(struct file *filp, fl_owner_t id)

 

2. 內核空間與用戶空間

在vfs_read和vfs_write函數中,其參數buf指向的用戶空間的內存地址,如果我們直接使用內核空間的指針,則會返回-EFALUT。這是因為使用的緩沖區超過了用戶空間的地址范圍。一般系統調用會要求你使用的緩沖區不能在內核區。這個可以用set_fs()、get_fs()來解決。

在include/asm/uaccess.h中,有如下定義:

#define MAKE_MM_SEG(s) ((mm_segment_t) { (s) })

#define KERNEL_DS MAKE_MM_SEG(0xFFFFFFFF)

#define USER_DS MAKE_MM_SEG(PAGE_OFFSET)

#define get_ds() (KERNEL_DS)

#define get_fs() (current->addr_limit)

#define set_fs(x) (current->addr_limit = (x))

 

如果使用,如下:

mm_segment_t fs = get_fs();

set_fs(KERNEL_FS);

//vfs_write();

vfs_read();

set_fs(fs);

 

詳盡解釋:系統調用本來是提供給用戶空間的程序訪問的,所以,對傳遞給它的參數(比如上面的buf),它默認會認為來自用戶空間,在read或write()函數中,為了保護內核空間,一般會用get_fs()得到的值來和USER_DS進行比較,從而防止用戶空間程序“蓄意”破壞內核空間;而現在要在內核空間使用系統調用,此時傳遞給read或write()的參數地址就是內核空間的地址了,在USER_DS之上(USER_DS ~ KERNEL_DS),如果不做任何其它處理,在write()函數中,會認為該地址超過了USER_DS范圍,所以會認為是用戶空間的“蓄意破壞”,從而不允許進一步的執行;為了解決這個問題; set_fs(KERNEL_DS);將其能訪問的空間限制擴大到KERNEL_DS,這樣就可以在內核順利使用系統調用了!

 

在VFS的支持下,用戶態進程讀寫任何類型的文件系統都可以使用read和write着兩個系統調用,但是在linux內核中沒有這樣的系統調用我們如何操作文件呢?我們知道read和write在進入內核態之后,實際執行的是sys_read和sys_write,但是查看內核源代碼,發現這些操作文件的函數都沒有導出(使用EXPORT_SYMBOL導出),也就是說在內核模塊中是不能使用的,那如何是好?

通過查看sys_open的源碼我們發現,其主要使用了do_filp_open()函數,該函數在fs/namei.c中,而在改文件中,filp_open函數也是調用了do_filp_open函數,並且接口和sys_open函數極為相似,調用參數也和sys_open一樣,並且使用EXPORT_SYMBOL導出了,所以我們猜想該函數可以打開文件,功能和open一樣。使用同樣的查找方法,我們找出了一組在內核中操作文件的函數,如下:

功能 函數原型
打開文件 struct file *filp_open(const char *filename,int flags, int mode)
讀取文件 ssize_t vfs_read(struct file *file,char __user *buf, size_t count, loff_t *pos)
寫文件 ssize_t vfs_write(struct file *file,const char __user *buf,size_t count, loff_t *pos)
關閉文件 int filp_close(struct file *filp, fl_owner_t id)

 

我們注意到在vfs_read和vfs_write函數中,其參數buf指向的用戶空間的內存地址,如果我們直接使用內核空間的指針,則會返回-EFALUT。所以我們需要使用
set_fs()和get_fs()宏來改變內核對內存地址檢查的處理方式,所以在內核空間對文件的讀寫流程為:

  1. mm_segment_tfs = get_fs();
  2. set_fs(KERNEL_FS);
  3. //vfs_write();
  4. vfs_read();
  5. set_fs(fs);

下面為一個在內核中對文件操作的例子:

#include <linux/module.h>
#include <linux/init.h>
#include <linux/fs.h>
#include <linux/uaccess.h>
static charbuf[] ="你好"; static charbuf1[10]; int __inithello_init(void) { struct file *fp; mm_segment_t fs; loff_t pos;
printk(
"hello enter/n"); fp = filp_open("/home/niutao/kernel_file",O_RDWR | O_CREAT,0644); if (IS_ERR(fp)){ printk("create file error/n"); return -1; }
fs
= get_fs(); set_fs(KERNEL_DS); pos =0; vfs_write(fp, buf, sizeof(buf), &pos); pos =0; vfs_read(fp, buf1, sizeof(buf), &pos); printk("read: %s/n",buf1); filp_close(fp,NULL); set_fs(fs); return 0; }
void __exithello_exit(void) { printk("hello exit/n"); } module_init(hello_init); module_exit(hello_exit); MODULE_LICENSE("GPL");

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM