最近看了本書,突然對於地址空間有些疑惑。在深入理解linux內核中把地址分為三類:邏輯地址(匯編語言中操作數地址或指令的地址,對於80x86的cup,邏輯地址是段+段內偏移地址)、線性地址(也叫虛擬地址)和物理地址。但在Stott Maxwell的《Linux Core Kernel Commentrary》中確是這樣分的:邏輯地址(也叫虛擬地址)、線性地址和物理地址。按照386 CPU總設計師 John Crowford的解釋,虛擬地址是保護模式下段和段內偏移量組成的地址,而邏輯地址就是代碼段內偏移量,或稱進程的邏輯地址。其實對於linux來說,這三種說法都沒錯,由於linux下並不主張將程序分段,而是主張分頁,所以即使是在80x86的體系結構下,段的基地址也是0。因此邏輯地址、線性地址、虛擬地址在linux中其實是相同的。所以對於linux下的elf可執行文件來說,代碼段的起始地址0x08048000既是邏輯地址,也是線性地址也是虛擬地址。
1 x86的物理地址空間布局:
物理地址空間的頂部以下一段空間,被PCI設備的I/O內存映射占據,它們的大小和布局由PCI規范所決定。640K~1M這段地址空間被BIOS和VGA適配器所占據。
Linux系統在初始化時,會根據實際的物理內存的大小,為每個物理頁面創建一個page對象,所有的page對象構成一個mem_map數組。
進一步,針對不同的用途,Linux內核將所有的物理頁面划分到3類內存管理區中,如圖,分別為ZONE_DMA,ZONE_NORMAL,ZONE_HIGHMEM。
ZONE_DMA的范圍是0~16M,該區域的物理頁面專門供I/O設備的DMA使用。之所以需要單獨管理DMA的物理頁面,是因為DMA使用物理地址訪問內存,不經過MMU,並且需要連續的緩沖區,所以為了能夠提供物理上連續的緩沖區,必須從物理地址空間專門划分一段區域用於DMA。
ZONE_NORMAL的范圍是16M~896M,該區域的物理頁面是內核能夠直接使用的。
ZONE_HIGHMEM的范圍是896M~結束,該區域即為高端內存,內核不能直接使用。
2 linux虛擬地址內核空間分布
在kernel image下面有16M的內核空間用於DMA操作。位於內核空間高端的128M地址主要由3部分組成,分別為vmalloc area,持久化內核映射區,臨時內核映射區。
由於ZONE_NORMAL和內核線性空間存在直接映射關系,所以內核會將頻繁使用的數據如kernel代碼、GDT、IDT、PGD、mem_map數組等放在ZONE_NORMAL里。而將用戶數據、頁表(PT)等不常用數據放在ZONE_ HIGHMEM里,只在要訪問這些數據時才建立映射關系(kmap())。比如,當內核要訪問I/O設備存儲空間時,就使用ioremap()將位於物理地址高端的mmio區內存映射到內核空間的vmalloc area中,在使用完之后便斷開映射關系。 上面描述默認都是32位的機器,對於64位的機器,PAGE_OFFSET為0x0xffff880000000000,用戶地址空間范圍:0x0000000000000000 - 0x00007fffffffffff,內核代碼地址空間:0xffffffff80000000 - 0xffffffffa0000000。
3 linux虛擬地址用戶空間分布
用戶進程的代碼區一般從虛擬地址空間的0x08048000開始,這是為了便於檢查空指針。代碼區之上便是數據區,未初始化數據區,堆區,棧區,以及參數、全局環境變量。
4 linux虛擬地址與物理地址映射的關系
Linux將4G的線性地址空間分為2部分,0~3G為user space,3G~4G為kernel space。
由於開啟了分頁機制,內核想要訪問物理地址空間的話,必須先建立映射關系,然后通過虛擬地址來訪問。為了能夠訪問所有的物理地址空間,就要將全部物理地址空間映射到1G的內核線性空間中,這顯然不可能。於是,內核將0~896M的物理地址空間一對一映射到自己的線性地址空間中,這樣它便可以隨時訪問ZONE_DMA和ZONE_NORMAL里的物理頁面;此時內核剩下的128M線性地址空間不足以完全映射所有的ZONE_HIGHMEM,Linux采取了動態映射的方法,即按需的將ZONE_HIGHMEM里的物理頁面映射到kernel space的最后128M線性地址空間里,使用完之后釋放映射關系,以供其它物理頁面映射。雖然這樣存在效率的問題,但是內核畢竟可以正常的訪問所有的物理地址空間了。
5 linux中可執行程序與虛擬地址空間的映射關系
虛擬內存區域(VMA,Virtual Memory Area)是Linux中進程虛擬地址空間中的一個段,在Windows里面叫虛擬段。當操作系統創建線程后,會在進程相應的數據結構中設置一個.text段的VMA,它在虛擬空間中的地址為0x08048000~0x08049000,它對應ELF文件中的偏移為0的.text。可以查看操作系統為運行的進程維護的信息:
從上面的圖可以看出,虛擬空間地址為0x08048000~0x08049000的VMA映射為elf文件中的一個段(segment),並且是按整頁進行映射的。
由於linux下的ELF可執行文件會有很多個段(section),所以如果把每個section都映射為一個VMA,那么沒有一個頁大小的段(section)也會被映射為一個頁的VMA,這樣就浪費了物理空間,由於不足會用0補充。故elf有一個裝載的段(segment),與前面的段(section)不同,前面的段(section)主要用於鏈接,而段(segment)主要用於裝載進內存。
可以看出段(segment)02包含了很多的段(section),那鏈接器怎樣將段(section)合並到一個段(segment)中的呢?可以通過段(section)的權限來合並,如以代碼段為代表的權限為可讀可執行權限;以數據段和BSS段為代表的權限為可讀可寫的段;以只讀數據為代表的權限為只讀權限。
ELF與Linux進程虛擬空間映射關系如下圖所示:
即使把多個段(section)合並到幾個段(segment),每個段(segment)還是又很能產生較大的頁內碎片,怎樣解決這個問題呢?Unix巧妙的通過各個段(segment)接壤部分共享一個物理頁來解決這個問題。
參考:http://www.cnblogs.com/zszmhd/archive/2012/08/29/2661461.html、深入理解linux內核、Linux Core Kernel Commentrary、程序員的自我修養。