作 者:道哥,10+年的嵌入式開發老兵。
公眾號:【IOT物聯網小鎮】,專注於:C/C++、Linux操作系統、應用程序設計、物聯網、單片機和嵌入式開發等領域。 公眾號回復【書籍】,獲取 Linux、嵌入式領域經典書籍。
轉 載:歡迎轉載文章,轉載需注明出處。
在第一篇文章中,我們就提到,現代操作系統是從最古老的 8086
系統一步一步發展而來的。
處理器廠商為了向后兼容,很多底層相關的原理都是一樣的(如果不兼容,就會丟棄市場份額)。
特別是從系統上電之后,一直到操作系統中第一個進程(Linux 下就是 init 進程)運行起來,這其中經歷了 BIOS、引導程序、操作系統這三元大將的接力跑。
今天,我們從幾個特殊的地址的角度,來從宏觀節點上看一下系統的啟動過程。
0xFFFF:0x0000
這個地址,是處理器上電之后的第一個重要的物理地址。
從地址的書寫形式上,就可以看出這是 8086
系統中實模式下的段尋址方式:段地址 * 16 + 偏移量。
段地址:0xFFFF
偏移地址:0x0000
計算得到物理地址:0xFFFF0
當處理器的 reset
引腳被觸發后,處理器首先進行硬件初始化,也就是把處理器內部的每個寄存器都設置為一個初始的默認狀態:
把段寄存器 cs 設置為 0xFFFF,指令寄存器 ip 設置為 0x0000;
把其它的所有寄存器設置為 0x0000;
當所有的初始化完成之后,CPU 就開始執行第一條指令。
之前說過,CPU 是很傻、很單純的,它只知道去 cs:ip 所指向的地址處,取出一條指令,執行完之后,再取出下一條指令繼續執行。。。
每一條指令的第一個字節都是操作碼,CPU 根據操作碼,能夠知道當前指令的字節長度,並把 ip 寄存器指向下一條指令。
既然硬件初始化時,已經把 cs
初始化為 0xFFFF
,把 ip
初始化為 0x0000
,經過段尋址的公式計算之后,就得到了物理地址:0xFFFF0
,也就是說,CPU 執行的第一條指令位於物理地址 0xFFFF0
這個地方。
那么,這個物理地址中,存放着什么指令呢?
首先來復習一下地址范圍的相關知識:
8086 處理器有 20 根地址線,尋址范圍是:0x00000 ~ 0xFFFFF,最大就是 1 MB。
但是 8086 的處理器是 16 位的,寄存器最大表示的范圍是 0xFFFF,也就是 64 KB。
采用【段基址:偏移量】來表示一個段時,這個段的最大偏移范圍就是 64 KB。
我們再回到系統的啟動流程。
在上電之后,硬件會把一個 ROM
芯片,映射到內存地址空間的最高地址空間,也即是 1 MB
的位置,如圖:
ROM
芯片中存放的就是 BIOS
代碼,稱作:基本輸入輸出系統(Basic Input/Output System)。
此時,cs:ip
計算得到的物理地址為 0xFFFF0
,正好落在映射到 ROM
的這塊內存空間。
因此,從這個地址中獲取到指令,其實就是從 ROM 中讀取的。
所謂的映射:就是訪問某個地址空間中的內容時,就會自動定位到被映射的目標物理設備中進行訪問,這是由硬件來保證的。
CPU
在執行指令的時候,ip
寄存器是遞增的,也就是說會從低地址到高地址,依次執行每一條指令。
但是此時第一條指令的地址就是 0xFFFF0
,已經快接近 1 MB
地址空間的頂端了,只有 16
個字節的地址空間。
如果執行到頂端,溢出之后,就會回繞到最低地址 0x00000
。
因此,在這個第一條指令的位置處,是一條跳轉指令:
跳轉目標是 0xF000:0xE05B
,計算得到物理地址 0xFE05B
,可以看到同樣是落在映射到 ROM 的地址空間中(好像是廢話:此時只能執行 BIOS 中的代碼)。
0xF000:0xE05B
這個地址處的代碼,才是 BIOS
真正開始執行的地方。BIOS
所做的事情包括:
偵測硬件設備:系統中有哪些硬件設備,工作狀態是什么;
對硬件設備進行初始化:比如最初始的中斷向量表;
偵測操作系統啟動設備:選擇好一個系統盤之后,把系統盤中主引導扇區中的引導程序讀取到內存中;
在 BIOS
的最后一個步驟中,它把引導程序讀取到內存中 0x0000:0x7C00
地址處,計算得到物理地址就是:0x07C00
。
這個地址的內存空間,被硬件映射到 RAM 芯片中。
具體的說就是,硬件把內存空間 0x00000 ~ 0x9FFFF
映射到隨機存儲器中,一共是 640 KB
的空間。
注意:雖然地址空間有 640 KB
這么大,但是實際的 RAM 大小可能只有可憐的 32 KB
,因此實際可用的空間取決於物理芯片。
中間空着的那塊地址空間,映射到一些外設。
0x0000:0x7C00
這個地址,就是操作系統的引導代碼被讀取到內存中的地方。
在內存地址的剛開始位置(0x00000~0x003FF),存放着中斷向量表。
可以看到:操作系統引導代碼並沒有從中斷向量表之后的 0x00400
開始存放,而是被放在了 0x07C00
這個地方:
至於為什么要這么放置,有很多的說法,比較靠譜的解釋是這樣的:
假如實際的 RAM
芯片只有 32 KB
(不要用現代的眼光來看,在 N久 之前,RAM
還是非常的珍貴),那么內存布局就是這樣:
在此也鄙視一下現在很多的應用軟件,動不動就占用那么多的內存,都以為整個電腦只為它一家軟件服務的?!
可以看到,引導代碼幾乎位於 RAM
的頂端了,這樣的話,從中斷向量開始的 0x00400
,一直到引導代碼的 0x07C00
,這塊地址空間就是連續的一整塊,可以被操作系統更方便的操作。
另外,把引導代碼放在 RAM
的高地址處,還有一個好處:
當引導代碼最終把接力棒交給操作系統之后,引導代碼就沒有任何用處了。
因此,操作系統就可以直接把引導代碼所在的地址空間中內容,全部抹掉,為自己所用!
推薦閱讀
【1】C語言指針-從底層原理到花式技巧,用圖文和代碼幫你講解透徹
【2】一步步分析-如何用C實現面向對象編程
【3】原來gdb的底層調試原理這么簡單
【4】內聯匯編很可怕嗎?看完這篇文章,終結它!
其他系列專輯:精選文章、C語言、Linux操作系統、應用程序設計、物聯網