地址空間分布


  最近看了本書,突然對於地址空間有些疑惑。在深入理解linux內核中把地址分為三類:邏輯地址(匯編語言中操作數地址或指令的地址,對於80x86的cup,邏輯地址是段+段內偏移地址)、線性地址(也叫虛擬地址)和物理地址。但在Stott Maxwell的《Linux Core Kernel Commentrary》中確是這樣分的:邏輯地址(也叫虛擬地址)、線性地址和物理地址。按照386 CPU總設計師 John Crowford的解釋,虛擬地址是保護模式下段和段內偏移量組成的地址,而邏輯地址就是代碼段內偏移量,或稱進程的邏輯地址。其實對於linux來說,這三種說法都沒錯,由於linux下並不主張將程序分段,而是主張分頁,所以即使是在80x86的體系結構下,段的基地址也是0。因此邏輯地址、線性地址、虛擬地址在linux中其實是相同的。所以對於linux下的elf可執行文件來說,代碼段的起始地址0x08048000既是邏輯地址,也是線性地址也是虛擬地址。

  1 x86的物理地址空間布局:

 

  物理地址空間的頂部以下一段空間,被PCI設備的I/O內存映射占據,它們的大小和布局由PCI規范所決定。640K~1M這段地址空間被BIOSVGA適配器所占據 

  Linux系統在初始化時,會根據實際的物理內存的大小,為每個物理頁面創建一個page對象,所有的page對象構成一個mem_map數組。 

進一步,針對不同的用途,Linux內核將所有的物理頁面划分到3類內存管理區中,如圖,分別為ZONE_DMA,ZONE_NORMAL,ZONE_HIGHMEM。 

  ZONE_DMA的范圍是0~16M,該區域的物理頁面專門供I/O設備的DMA使用。之所以需要單獨管理DMA的物理頁面,是因為DMA使用物理地址訪問內存,不經過MMU,並且需要連續的緩沖區,所以為了能夠提供物理上連續的緩沖區,必須從物理地址空間專門划分一段區域用於DMA 

  ZONE_NORMAL的范圍是16M~896M,該區域的物理頁面是內核能夠直接使用的。 

  ZONE_HIGHMEM的范圍是896M~結束,該區域即為高端內存,內核不能直接使用。

linux虛擬地址內核空間分布

  在kernel image下面有16M的內核空間用於DMA操作。位於內核空間高端的128M地址主要由3部分組成,分別為vmalloc area,持久化內核映射區,臨時內核映射區。

  由於ZONE_NORMAL和內核線性空間存在直接映射關系,所以內核會將頻繁使用的數據如kernel代碼、GDT、IDT、PGD、mem_map數組等放在ZONE_NORMAL里。而將用戶數據、頁表(PT)等不常用數據放在ZONE_ HIGHMEM里,只在要訪問這些數據時才建立映射關系(kmap())。比如,當內核要訪問I/O設備存儲空間時,就使用ioremap()將位於物理地址高端的mmio區內存映射到內核空間的vmalloc area中,在使用完之后便斷開映射關系。 上面描述默認都是32位的機器,對於64位的機器,PAGE_OFFSET為0x0xffff880000000000,用戶地址空間范圍:0x0000000000000000 - 0x00007fffffffffff,內核代碼地址空間:0xffffffff80000000 - 0xffffffffa0000000。

3 linux虛擬地址用戶空間分布

  用戶進程的代碼區一般從虛擬地址空間的0x08048000開始,這是為了便於檢查空指針。代碼區之上便是數據區,未初始化數據區,堆區,棧區,以及參數、全局環境變量。

4 linux虛擬地址與物理地址映射的關系

 

  Linux4G的線性地址空間分為2部分,0~3Guser space3G~4Gkernel space

  由於開啟了分頁機制,內核想要訪問物理地址空間的話,必須先建立映射關系,然后通過虛擬地址來訪問。為了能夠訪問所有的物理地址空間,就要將全部物理地址空間映射到1G的內核線性空間中,這顯然不可能。於是,內核將0~896M的物理地址空間一對一映射到自己的線性地址空間中,這樣它便可以隨時訪問ZONE_DMAZONE_NORMAL里的物理頁面;此時內核剩下的128M線性地址空間不足以完全映射所有的ZONE_HIGHMEMLinux采取了動態映射的方法,即按需的將ZONE_HIGHMEM里的物理頁面映射到kernel space的最后128M線性地址空間里,使用完之后釋放映射關系,以供其它物理頁面映射。雖然這樣存在效率的問題,但是內核畢竟可以正常的訪問所有的物理地址空間了。

5 linux中可執行程序與虛擬地址空間的映射關系

  虛擬內存區域(VMA,Virtual Memory Area)是Linux中進程虛擬地址空間中的一個段,在Windows里面叫虛擬段。當操作系統創建線程后,會在進程相應的數據結構中設置一個.text段的VMA,它在虛擬空間中的地址為0x08048000~0x08049000,它對應ELF文件中的偏移為0.text。可以查看操作系統為運行的進程維護的信息:

 

從上面的圖可以看出,虛擬空間地址為0x08048000~0x08049000VMA映射為elf文件中的一個段(segment),並且是按整頁進行映射的。

  由於linux下的ELF可執行文件會有很多個段(section),所以如果把每個section都映射為一個VMA,那么沒有一個頁大小的段(section)也會被映射為一個頁的VMA,這樣就浪費了物理空間,由於不足會用0補充。故elf有一個裝載的段(segment),與前面的段(section)不同,前面的段(section)主要用於鏈接,而段(segment)主要用於裝載進內存。

 

  可以看出段(segment)02包含了很多的段(section),那鏈接器怎樣將段(section)合並到一個段(segment)中的呢?可以通過段(section)的權限來合並,如以代碼段為代表的權限為可讀可執行權限;以數據段和BSS段為代表的權限為可讀可寫的段;以只讀數據為代表的權限為只讀權限。

  ELFLinux進程虛擬空間映射關系如下圖所示:

 

  即使把多個段(section)合並到幾個段(segment),每個段(segment)還是又很能產生較大的頁內碎片,怎樣解決這個問題呢?Unix巧妙的通過各個段(segment)接壤部分共享一個物理頁來解決這個問題。 

參考:http://www.cnblogs.com/zszmhd/archive/2012/08/29/2661461.html、深入理解linux內核、Linux Core Kernel Commentrary、程序員的自我修養。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM