計算機管理內存的基本方式有兩種:段式管理和頁式管理。而在使用80x86微處理器時,內存地址分為三個不同的地址:邏輯地址,線性地址,物理地址。他們之間有什么關系,內存是如何尋址,本文主要介紹的就是內存尋址。
1、基本概念:
cpu段式管理:段式管理的基本原理是指把一個程序分成若干個段(segment)進行存儲,每個段都是一個邏輯實體(logical entity)。一個用戶作業或進程所包含的段對應一個二維線形虛擬空間,程序通過分段(segmentation)划分為多個模塊,故可以對程序的各個模塊分別編寫和編譯。段式管理程序以段為單位分配內存,然后通過地址影射機構把段式虛擬地址轉換為虛擬地址。
cpu頁式管理: 頁式管理的基本原理將各進程的虛擬空間划分成若干個長度相等的頁(一般為4K),頁式管理把內存空間按頁的大小划分成片或者頁面(page frame),然后把頁式虛擬地址與內存地址建立一一對應頁表,並用相應的硬件地址變換機構,來解決離散地址變換問題。
邏輯地址:包含在機器語言指令中用來指定一個操作數或一條指令的地址,每個邏輯地址都由一個段和偏移量組成,表示為[段標識符:段內偏移量]。例如,在C/C++程序中我們使用指針對變量地址操作,該地址就是邏輯地址(准確的應該說是邏輯地址的段內偏移量)。對應上述段式管理,邏輯地址是段式管理轉換前的程序地址。
線性地址:也稱為虛擬地址,它是一個32位無符號整數,故可以用來表達高達4GB的地址。線性地址同邏輯地址一樣也是不真實的地址。對應上述頁式管理,線性地址是頁式管理轉換前的地址。
物理地址:用於內存芯片級內存單元尋址,與處理器和CPU連接的地址總線相對應。一般情況下,我們說的計算機內存條中的內存就是它(雖然不准確)。
有了上述的基本概念后,很顯然,CPU將一個虛擬內存空間中的地址轉換為物理地址,需要進行兩步:首先將給定一個邏輯地址,CPU要利用其段式內存管理單元,先將每個邏輯地址轉換成一個線程地址,再利用其頁式內存管理單元,轉換為最終物理地址。這就是我們所知道的段頁式管理,這樣兩次轉換的好處可以克服段式管理和頁式管理的缺點。
2、CPU段式內存管理:邏輯地址轉換為線性地址
邏輯地址由兩部分組成:一個段標識符和一個指定段內相對地址的偏移量(簡稱偏移量),[段標識符: 段內偏移量]。
段標識符是由一個16位長的字段組成,稱為段選擇符,由處理器提供段寄存器來存放段標識符,段寄存器有6種:
(1)cs 代碼段寄存器,指向包含程序指令的段;
(2)ss 棧寄存器,指向包含當前程序的段;
(3)ds 數據段寄存器,指向包含靜態數據或者全局數據段;
(4)其他三個寄存器es, fs, gs稱為附加段寄存器,作一般用途,可以指向任意的數據段。
偏移量指明了從段開始的地方到實際地址之間的距離,偏移量為32位。
如上圖為段標識符(段選擇符)格式,其中最關鍵的部分為索引號。
段標識符,按照其字面意思便可理解它的作用是用來標識一個段的,而段是如何表示的呢?
這就引申到了另外一個概念:段描述符,每個段由一個8字節的段描述符表示,它描述了段的特征(段描述符就是段)。段標識符通過索引號(13位)就可以找到其對應的段(段描述符),段的格式如下圖所示:
段描述符中我們需要關注的字段為:Base,它描述了一個段的開始位置的線性地址。
段描述符放在全局描述符表(GDT,存放於gdtr寄存器中)或局部描述符表(LDT,存放於ldtr寄存器中)中,通常只定義一個GDT,而每個進程除了存放在GDT中的段之外如果還學要創建附加的段,就可以有自己的LDT。。
好了,通過上述的講解,我們就可以關注一個邏輯地址是怎樣轉化成相應的線性地址的,具體步驟如下:
(1)先檢查邏輯地址的段選擇符的TI字段,以決定段描述符保存在哪一個描述符表中。(TI=0表明在GDT中,TI=1表明存在LDT中)
(2)根據段選擇符的索引號,計算查找段描述符的地址,方法:索引號*8 + gdtr或者ldtr寄存器中的內容 = Base。
(3)把邏輯地址的偏移量與步驟(2)中得到的Base字段值相加就可以得到其對應的線性地址。
邏輯地址的轉換圖如下圖所示:
3、CPU頁式內存管理:線性地址轉換為物理地址
首先,我們得知道一些線性地址相關的東西。
(1)線性地址被分成固定長度為單位的組,稱為頁。頁內部連續的線性地址被映射到連續的物理地址中。
(2)分頁段元把所有的物理地址分成固定長度的頁框,稱為物理頁。
(3)線性地址映射到物理地址的數據結構稱為頁表。
(4)32位的線性地址,被分成3個域:目錄(Directory)高10位,頁表(Table)中間10位,偏移量(Offset)低12位,由偏移量的12bit可知,每頁含有4096字節的數據。
線性地址的轉換分兩步完成,每一步都基於一種都基於一種轉換表,第一種轉換表稱為頁目錄表轉換,第二種轉換稱為頁表轉換。使用這種二級模式的目的在於減少每個進程頁表所需的RAM的數量。就像我們看書有個書目錄一樣,方便快捷。具體轉換如下圖所示:
轉換步驟:
(1)從cr3中取出進程的頁目錄地址(操作系統負責在調度進程的時候,把這個地址裝入對應寄存器);
(2)根據線性地址前十位,在數組中,找到對應的索引項,因為引入了二級管理模式,頁目錄中的項,不再是頁的地址,而是一個頁表的地址。(又引入了一個數組),頁的地址被放到頁表中去了。
(3)根據線性地址的中間十位,在頁表(也是數組)中找到頁的起始地址;
(4)將頁的起始地址與線性地址中最后12位相加,得到最終我們想要的其對應的物理地址。
參考:
(1)深入理解linux內核