linux內核內存管理(zone_dma zone_normal zone_highmem)


Linux 操作系統和驅動程序運行在內核空間,應用程序運行在用戶空間,兩者不能簡單地使用指針傳遞數據,因為Linux使用的虛擬內存機制,用戶空間的數據可能被換出,當內核空間使用用戶空間指針時,對應的數據可能不在內存中。

 

   Linux內核地址空間划分

通常32位Linux內核地址空間划分0~3G為用戶空間,3~4G為內核空間。注意這里是32位內核地址空間划分,64位內核地址空間划分是不同的。

 

1、x86的物理地址空間布局:

 

wKiom1Nm_tiyhQPXAACWQfYUvVU353.jpg

 

  物理地址空間的頂部以下一段空間,被PCI設備的I/O內存映射占據,它們的大小和布局由PCI規范所決定。640K~1M這段地址空間被BIOS和VGA適配器所占據。

  Linux系統在初始化時,會根據實際的物理內存的大小,為每個物理頁面創建一個page對象,所有的page對象構成一個mem_map數組。

進一步,針對不同的用途,Linux內核將所有的物理頁面划分到3類內存管理區中,如圖,分別為ZONE_DMA,ZONE_NORMAL,ZONE_HIGHMEM。

  ZONE_DMA的范圍是0~16M,該區域的物理頁面專門供I/O設備的DMA使用。之所以需要單獨管理DMA的物理頁面,是因為DMA使用物理地址訪問內存,不經過MMU,並且需要連續的緩沖區,所以為了能夠提供物理上連續的緩沖區,必須從物理地址空間專門划分一段區域用於DMA。

  ZONE_NORMAL的范圍是16M~896M,該區域的物理頁面是內核能夠直接使用的。

  ZONE_HIGHMEM的范圍是896M~結束,該區域即為高端內存,內核不能直接使用。

 

2、linux虛擬地址內核空間分布

 

wKiom1Nm_tezL0_TAACljE7bXGU278.jpg

  在kernel image下面有16M的內核空間用於DMA操作。位於內核空間高端的128M地址主要由3部分組成,分別為vmalloc area,持久化內核映射區,臨時內核映射區。

  由於ZONE_NORMAL和內核線性空間存在直接映射關系,所以內核會將頻繁使用的數據如kernel代碼、GDT、IDT、PGD、mem_map數組等放在ZONE_NORMAL里。而將用戶數據、頁表(PT)等不常用數據放在ZONE_ HIGHMEM里,只在要訪問這些數據時才建立映射關系(kmap())。比如,當內核要訪問I/O設備存儲空間時,就使用ioremap()將位於物理地址高端的mmio區內存映射到內核空間的vmalloc area中,在使用完之后便斷開映射關系。

 

3、linux虛擬地址用戶空間分布

wKiom1NnADvC07kmAACCVbbosf0493.jpg

  用戶進程的代碼區一般從虛擬地址空間的0x08048000開始,這是為了便於檢查空指針。代碼區之上便是數據區,未初始化數據區,堆區,棧區,以及參數、全局環境變量。

4、linux虛擬地址與物理地址映射的關系

 

wKioL1Nm_qiCvmYxAADRFZV_1jQ205.jpg

 

  Linux將4G的線性地址空間分為2部分,0~3G為user space,3G~4G為kernel space。

  由於開啟了分頁機制,內核想要訪問物理地址空間的話,必須先建立映射關系,然后通過虛擬地址來訪問。為了能夠訪問所有的物理地址空間,就要將全部物理地址空間映射到1G的內核線性空間中,這顯然不可能。於是,內核將0~896M的物理地址空間一對一映射到自己的線性地址空間中,這樣它便可以隨時訪問ZONE_DMA和ZONE_NORMAL里的物理頁面;此時內核剩下的128M線性地址空間不足以完全映射所有的ZONE_HIGHMEM,Linux采取了動態映射的方法,即按需的將ZONE_HIGHMEM里的物理頁面映射到kernel space的最后128M線性地址空間里,使用完之后釋放映射關系,以供其它物理頁面映射。雖然這樣存在效率的問題,但是內核畢竟可以正常的訪問所有的物理地址空間了。

 

5、buddyinfo的理解

cat /proc/buddyinfo 顯示如下:

Node 0, zone      DMA       0      4      5      4      4      3 ...

Node 0, zone   Normal      1      0      0      1    101     8 ...

Node 0, zone  HighMem    2      0      0      1      1       0 ...

其中,Node表示在NUMA環境下的節點號,這里只有一個節點0;zone表示每一個節點下的區域,一般有DMA、Normal和HignMem三個區域;后面的列表示,伙伴系統中每一個order對應的空閑頁面塊。例如,對於zone DMA的第二列(從0開始算起),空閑頁面數為5*2^4,可用內存為5*2^4*PAGE_SIZE。

 

計算方法就是:

                     當前列的數字*2^列數*PAGE_SIZE 其中列數是從0開始計算的,即第一列是 當前列的數字*2^0*PAGE_SIZE



 

常見問題:

1、用戶空間(進程)是否有高端內存概念?

用戶進程沒有高端內存概念。只有在內核空間才存在高端內存。用戶進程最多只可以訪問3G物理內存,而內核進程可以訪問所有物理內存。

 

2、64位內核中有高端內存嗎?

目前現實中,64位Linux內核不存在高端內存,因為64位內核可以支持超過512GB內存。若機器安裝的物理內存超過內核地址空間范圍,就會存在高端內存。

 

3、用戶進程能訪問多少物理內存?內核代碼能訪問多少物理內存?

32位系統用戶進程最大可以訪問3GB,內核代碼可以訪問所有物理內存。

64位系統用戶進程最大可以訪問超過512GB,內核代碼可以訪問所有物理內存。

 

4、高端內存和物理地址、邏輯地址、線性地址的關系?

高端內存只和邏輯地址有關系,和邏輯地址、物理地址沒有直接關系。

 

5、為什么不把所有的地址空間都分配給內核?

若把所有地址空間都給內存,那么用戶進程怎么使用內存?怎么保證內核使用內存和用戶進程不起沖突?


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM