當u-boot開始運行bootcmd命令,就進入Linux內核啟動階段。與u-boot類似,普通Linux內核的啟動過程也能夠分為兩個階段,但針對壓縮了的內核如uImage就要包含內核自解壓過程了。本文以linux-2.6.37版源代碼為例分三個階段來描寫敘述內核啟動全過程。第一階段為內核自解壓過程,第二階段主要工作是設置ARM處理器工作模式、使能MMU、設置一級頁表等,而第三階段則主要為C代碼,包含內核初始化的所有工作,以下是具體介紹。
/******************************************************************************************************************************************/
轉載:http://blog.csdn.net/gqb_driver/article/details/26954425,作者:gqb666
/******************************************************************************************************************************************/
一、Linux內核自解壓過程
在linux內核啟動過程中一般能看到圖1內核自解壓界面,本小節本文重點討論內核的自解壓過程。
圖1 解壓內核
內核壓縮和解壓縮代碼都在文件夾kernel/arch/arm/boot/compressed。編譯完畢后將產生head.o、misc.o、piggy.gzip.o、vmlinux、decompress.o這幾個文件,head.o是內核的頭部文件。負責初始設置;misc.o將主要負責內核的解壓工作。它在head.o之后;piggy.gzip.o是一個中間文件,事實上是一個壓縮的內核(kernel/vmlinux),僅僅只是沒有和初始化文件及解壓文件鏈接而已;vmlinux是沒有(zImage是壓縮過的內核)壓縮過的內核。就是由piggy.gzip.o、head.o、misc.o組成的,而decompress.o是為支持很多其它的壓縮格式而新引入的。
在BootLoader完畢系統的引導以后並將Linux內核調入內存之后,調用do_bootm_linux()。這個函數將跳轉到kernel的起始位置。假設kernel沒有被壓縮。就能夠啟動了。假設kernel被壓縮過。則要進行解壓,在壓縮過的kernel頭部有解壓程序。壓縮過的kernel入口第一個文件源代碼位置在arch/arm/boot/compressed/head.S。它將調用函數decompress_kernel()。這個函數在文件arch/arm/boot/compressed/misc.c中。decompress_kernel()又調用proc_decomp_setup(),arch_decomp_setup()進行設置,然后打印出信息“Uncompressing Linux...”后,調用gunzip()將內核放於指定的位置。
以下簡介一下解壓縮過程,也就是函數decompress_kernel實現的功能:解壓縮代碼位於kernel/lib/inflate.c,inflate.c是從gzip源程序中分離出來的,包括了一些對全局數據的直接引用。在使用時須要直接嵌入到代碼中。gzip壓縮文件時總是在前32K字節的范圍內尋找反復的字符串進行編碼, 在解壓時須要一個至少為32K字節的解壓緩沖區,它定義為window[WSIZE]。inflate.c使用get_byte()讀取輸入文件,它被定義成宏來提高效率。
輸入緩沖區指針必須定義為inptr,inflate.c中對之有減量操作。
inflate.c調用flush_window()來輸出window緩沖區中的解壓出的字節串。每次輸出長度用outcnt變量表示。在flush_window()中,還必須對輸出字節串計算CRC而且刷新crc變量。在調用gunzip()開始解壓之前,調用makecrc()初始化CRC計算表。最后gunzip()返回0表示解壓成功。我們在內核啟動的開始都會看到這種輸出:
UncompressingLinux...done, booting the kernel.
這也是由decompress_kernel函數輸出的。運行完解壓過程。再返回到head.S中的583行,啟動內核
call_kernel: bl cache_clean_flush bl cache_off mov r0, #0 @ must be zero mov r1, r7 @ restore architecture number mov r2, r8 @ restore atags pointer mov pc, r4 @ call kernel
當中r4中已經在head.S的第180行處預置為內核鏡像的地址,例如以下代碼:
#ifdef CONFIG_AUTO_ZRELADDR @determine final kernel image address mov r4, pc and r4, r4, #0xf8000000 add r4, r4, #TEXT_OFFSET #else ldr r4, =zreladdr #endif
這樣就進入Linux內核的第一階段,我們也稱之為stage1。
二、Linux內核啟動第一階段stage1
承接上文,這里所以說的第一階段stage1就是內核解壓完畢並出現Uncompressing Linux...done,booting the kernel.之后的階段。該部分代碼實如今arch/arm/kernel的 head.S中。該文件里的匯編代碼通過查找處理器內核類型和機器碼類型調用對應的初始化函數,再建 立頁表,最后跳轉到start_kernel()函數開始內核的初始化工作。檢測處理器類型是在匯編子函數__lookup_processor_type中完畢的,通過下面代碼可實現對它的調用:bl__lookup_processor_type(在文件head-commom.S實現)。__lookup_processor_type調用結束返回原程序時,會將返回結果保存到寄存器中。當中r5寄存器返回一個用來描寫敘述處理器的結構體地址,並對r5進行推斷,假設r5的值為0則說明不支持這樣的處理器。將進入__error_p。r8保存了頁表的標志位,r9 保存了處理器的ID 號,r10保存了與處理器相關的struct proc_info_list結構地址。
Head.S核心代碼例如以下:
ENTRY(stext) setmode PSR_F_BIT | PSR_I_BIT | SVC_MODE, r9 @設置SVC模式關中斷 mrc p15, 0, r9, c0, c0 @ 獲得處理器ID。存入r9寄存器 bl __lookup_processor_type @ 返回值r5=procinfo r9=cpuid movs r10, r5 THUMB( it eq ) @ force fixup-able long branch encoding beq __error_p @假設返回值r5=0,則不支持當前處理器' bl __lookup_machine_type @ 調用函數,返回值r5=machinfo movs r8, r5 @ 假設返回值r5=0,則不支持當前機器(開發板) THUMB( it eq ) @ force fixup-able long branch encoding beq __error_a @ 機器碼不匹配。轉__error_a並打印錯誤信息 bl __vet_atags #ifdef CONFIG_SMP_ON_UP @ 假設是多核處理器進行對應設置 bl __fixup_smp #endif bl __create_page_tables @最后開始創建頁表
檢測機器碼類型是在匯編子函數__lookup_machine_type (相同在文件head-common.S實現) 中完畢的。與__lookup_processor_type類似,通過代碼:“bl __lookup_machine_type”來實現對它的調 用。該函數返回時,會將返回結構保存放在r5、r6 和r7三個寄存器中。
當中r5寄存器返回一個用來描寫敘述機器(也就是開發板)的結構體地址,並對r5進行推斷,假設r5的值為0則說明不支持這樣的機器(開發板),將進入__error_a,打印出內核不支持u-boot傳入的機器碼的錯誤如圖2。
r6保存了I/O基地址,r7 保存了 I/O的頁表偏移地址。 當檢測處理器類型和機器碼類型結束后,將調用__create_page_tables子函數來建立頁表,它所要做的工作就是將 RAM 基地址開始的1M 空間的物理地址映射到 0xC0000000開始的虛擬地址處。對本項目的開發板DM3730而言,RAM掛接到物理地址0x80000000處,當調用__create_page_tables 結束后 0x80000000 ~ 0x80100000物理地址將映射到 0xC0000000~0xC0100000虛擬地址處。
當全部的初始化結束之后。使用例如以下代碼來跳到C 程序的入口函數start_kernel()處。開始之后的內核初始化工作: bSYMBOL_NAME(start_kernel) 。
圖2 機器碼不匹配錯誤
三、Linux內核啟動第二階段stage2
從start_kernel函數開始
Linux內核啟動的第二階段從start_kernel函數開始。
start_kernel是全部Linux平台進入系統內核初始化后的入口函數,它主要完畢剩余的與 硬件平台相關的初始化工作,在進行一系列與內核相關的初始化后,調用第一個用戶進程- init 進程並等待用戶進程的運行。這樣整個 Linux內核便啟動完畢。該函數位於init/main.c文件里,主要工作流程如圖3所看到的:
圖3 start_kernel流程圖
該函數所做的詳細工作有 :
1) 調用setup_arch()函數進行與體系結構相關的第一個初始化工作。對不同的體系結構來說該函數有不同的定義。
對於ARM平台而言,該函數定義在 arch/arm/kernel/setup.c。它首先通過檢測出來的處理器類型進行處理器內核的初始化。然后 通過bootmem_init()函數依據系統定義的meminfo結構進行內存結構的初始化,最后調用 paging_init()開啟MMU,創建內核頁表,映射全部的物理內存和IO空間。
2) 創建異常向量表和初始化中斷處理函數;
3) 初始化系統核心進程調度器和時鍾中斷處理機制。
4) 初始化串口控制台(console_init);
ARM-Linux 在初始化過程中一般都會初始化一個串口做為內核的控制台。而串口Uart驅動卻把串口設備名寫死了。如本例中linux2.6.37串口設備名為ttyO0,而不是經常使用的ttyS0。有了控制台內核在啟動過程中就能夠通過串口輸出信息以便開發人員或用戶了解系統的啟動進程。
5) 創建和初始化系統cache。為各種內存調用機制提供緩存。包含;動態內存分配,虛擬文件系統(VirtualFile System)及頁緩存。
6) 初始化內存管理。檢測內存大小及被內核占用的內存情況;
7) 初始化系統的進程間通信機制(IPC); 當以上全部的初始化工作結束后,start_kernel()函數會調用rest_init()函數來進行最后的初始化,包含創建系統的第一個進程-init進程來結束內核的啟動。
掛載根文件系統並啟動init
Linux內核啟動的下一過程是啟動第一個進程init。但必須以根文件系統為載體,所以在啟動init之前,還要掛載根文件系統。
四、掛載根文件系統
根文件系統至少包含下面文件夾:
/etc/:存儲重要的配置文件。
/bin/:存儲經常使用且開機時必須用到的運行文件。
/sbin/:存儲着開機過程中所需的系統運行文件。
/lib/:存儲/bin/及/sbin/的運行文件所需的鏈接庫,以及Linux的內核模塊。
/dev/:存儲設備文件。
注:五大文件夾必須存儲在根文件系統上,缺一不可。
以僅僅讀的方式掛載根文件系統。之所以採用僅僅讀的方式掛載根文件系統是由於:此時Linux內核仍在啟動階段,還不是非常穩定,假設採用可讀可寫的方式掛載根文件系統。萬一Linux不小心宕機了,一來可能破壞根文件系統上的數據。再者Linux下次開機時得花上非常長的時間來檢查並修復根文件系統。
掛載根文件系統的而目的有兩個:一是安裝適當的內核模塊,以便驅動某些硬件設備或啟用某些功能;二是啟動存儲於文件系統中的init服務。以便讓init服務接手興許的啟動工作。
運行init服務
Linux內核啟動后的最后一個動作。就是從根文件系統上找出並運行init服務。
Linux內核會按照下列的順序尋找init服務:
1)/sbin/是否有init服務
2)/etc/是否有init服務
3)/bin/是否有init服務
4)假設都找不到最后運行/bin/sh
找到init服務后,Linux會讓init服務負責興許初始化系統使用環境的工作,init啟動后,就代表系統已經順利地啟動了linux內核。啟動init服務時。init服務會讀取/etc/inittab文件,依據/etc/inittab中的設置數據進行初始化系統環境的工作。
/etc/inittab定義init服務在linux啟動過程中必須依序運行下面幾個Script:
/etc/rc.d/rc.sysinit
/etc/rc.d/rc
/etc/rc.d/rc.local
/etc/rc.d/rc.sysinit基本的功能是設置系統的基本環境,當init服務運行rc.sysinit時 要依次完畢以下一系列工作:
(1)啟動udev
(2)設置內核參數
運行sysctl –p,以便從/etc/sysctl.conf設置內核參數
(3)設置系統時間
將硬件時間設置為系統時間
(4)啟用交換內存空間
運行swpaon –a –e,以便依據/etc/fstab的設置啟用全部的交換內存空間。
(5)檢查並掛載全部文件系統
檢查全部須要掛載的文件系統。以確保這些文件系統的完整性。
檢查完成后以可讀可寫的方式掛載文件系統。
(6)初始化硬件設備
Linux除了在啟動內核時以靜態驅動程序驅動部分的硬件外。在運行rc.sysinit時,也會試着驅動剩余的硬件設備。rc.sysinit驅動的硬件設備包括下面幾項:
a)定義在/etc/modprobe.conf的模塊
b)ISA PnP的硬件設備
c)USB設備
(7)初始化串行port設備
Init服務會管理全部的串行port設備。比方調制解調器、不斷電系統、串行port控制台等。Init服務則通過rc.sysinit來初始化linux的串行port設備。當rc.sysinit發現linux才干在這/etc/rc.serial時。才會運行/etc/rc.serial,借以初始化全部的串行port設備。
因此,你能夠在/etc/rc.serial中定義怎樣初始化linux全部的串行port設備。
(8)清除過期的鎖定文件與IPC文件
(9)建立用戶接口
在運行完3個基本的RC Script后,init服務的最后一個工作,就是建立linux的用戶界面,好讓用戶能夠使用linux。此時init服務會運行下面兩項工作:
(10)建立虛擬控制台
Init會在若干個虛擬控制台中運行/bin/login。以便用戶能夠從虛擬控制台登陸linux。linux默認在前6個虛擬控制台,也就是tty1~tty6,運行/bin/login登陸程序。
當全部的初始化工作結束后,cpu_idle()函數會被調用來使系統處於閑置(idle)狀態並等待用戶程序的運行。至此。整個Linux內核啟動完成。
整個過程見圖4。
圖4:linux內核啟動及文件系統載入全過程