文件映射的原理

本文轉載自查看原文 2018-04-13 09:34 4329 計算機基礎

轉於：https://blog.csdn.net/mengxingyuanlove/article/details/50986092

一、原理

首先，“映射”這個詞，就和數學課上說的“一一映射”是一個意思，就是建立一種一一對應關系，在這里主要是只 硬盤上文件的位置，與進程 邏輯地址空間中一塊大小相同的區域之間的一一對應，如圖1中過程1所示。這種對應關系純屬是邏輯上的概念，物理上是不存在的，原因是進程的邏輯地址空間本身就是不存在的。在內存映射的過程中，並沒有實際的數據拷貝，文件沒有被載入內存，只是邏輯上被放入了內存，具體到代碼，就是建立並初始化了相關的數據結構（struct address_space），這個過程有系統調用mmap()實現，所以建立內存映射的效率很高。

圖1.內存映射原理

問：既然建立內存映射沒有進行實際的數據拷貝，那么進程又怎么能最終直接通過內存操作訪問到硬盤上的文件呢？

　　mmap()會返回一個指針ptr，它指向進程邏輯地址空間中的一個地址，這樣以后，進程無需再調用read或write對文件進行讀寫，而只需要通過ptr就能夠操作文件。但是ptr所指向的是一個邏輯地址，要操作其中的數據，必須通過MMU將邏輯地址轉換成物理地址，如圖1中過程2所示。這個過程與內存映射無關。

　　前面講過，建立內存映射並沒有實際拷貝數據，這時，MMU在地址映射表中是無法找到與ptr相對應的物理地址的，也就是MMU失敗，將產生一個缺頁中斷，缺頁中斷的中斷響應函數會在swap中尋找相對應的頁面，如果找不到（也就是該文件從來沒有被讀入內存的情況），則會通過mmap()建立的映射關系，從硬盤上將文件讀取到物理內存中，如圖1中過程3所示。這個過程與內存映射無關。

　　如果在拷貝數據時，發現物理內存不夠用，則會通過虛擬內存機制（swap）將暫時不用的物理頁面交換到硬盤上，如圖1中過程4所示。這個過程也與內存映射無關。

二、效率

問：用文件映射的方法對文件進行操作，效率要比read和write系統調用高，這是為什么呢？　　

　　1）從代碼層面上看，從硬盤上將文件讀入內存，都要經過文件系統進行數據拷貝，並且數據拷貝操作是由文件系統和硬件驅動實現的，理論上來說，拷貝數據的效率是一樣的。

　　2）read()是系統調用，其中進行了數據拷貝，它首先將文件內容從硬盤拷貝到內核空間的一個緩沖區，如圖2中過程1，然后再將這些數據拷貝到用戶空間，如圖2中過程2，在這個過程中，實際上完成了兩次數據拷貝；而mmap()也是系統調用，如前所述，mmap()中沒有進行數據拷貝，真正的數據拷貝是在缺頁中斷處理時進行的，由於mmap()將文件直接映射到用戶空間，所以中斷處理函數根據這個映射關系，直接將文件從硬盤拷貝到用戶空間，只進行了一次數據拷貝。

　　因此，內存映射的效率要比read/write效率高。

圖2.read系統調用原理

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 JAVA NIO之淺談內存映射文件原理與DirectMemory 內存映射原理內存映射的原理 Mybatis映射文件的映射問題 ibatis是怎么實現映射的，它的映射原理是什么從SpringBoot源碼看資源映射原理 MFC消息映射的原理：筆記 MyBatis SQL映射文件 SQL 映射的 XML 文件 Hibernate映射文件詳解