linux的啟動流程詳解


linux啟動流程

一、第一階段:BIOS

上個世紀70年代初,"只讀內存"(read-only memory,縮寫為ROM)發明,開機程序被刷入ROM芯片,計算機通電后,第一件事就是讀取它。

這塊芯片里的程序叫做"基本輸出輸入系統"(Basic Input/Output System),簡稱為BIOS。

1.1 硬件自檢

BIOS程序首先檢查,計算機硬件能否滿足運行的基本條件,這叫做"硬件自檢"(Power-On Self-Test),縮寫為POST。

如果硬件出現問題,主板會發出不同含義的蜂鳴,啟動中止。如果沒有問題,屏幕就會顯示出CPU、內存、硬盤等信息。

1.2 啟動順序

硬件自檢完成后,BIOS把控制權轉交給下一階段的啟動程序。

這時,BIOS需要知道,"下一階段的啟動程序"具體存放在哪一個設備。也就是說,BIOS需要有一個外部儲存設備的排序,排在前面的設備就是優先轉交控制權的設備。這種排序叫做"啟動順序"(Boot Sequence)。

打開BIOS的操作界面,里面有一項就是"設定啟動順序"。

二、第二階段:主引導記錄

BIOS按照"啟動順序",把控制權轉交給排在第一位的儲存設備。

這時,計算機讀取該設備的第一個扇區,也就是讀取最前面的512個字節。如果這512個字節的最后兩個字節是0x55和0xAA,表明這個設備可以用於啟動;如果不是,表明設備不能用於啟動,控制權於是被轉交給"啟動順序"中的下一個設備。

這最前面的512個字節,就叫做"主引導記錄"(Master boot record,縮寫為MBR)。

2.1 主引導記錄的結構

"主引導記錄"只有512個字節,放不了太多東西。它的主要作用是,告訴計算機到硬盤的哪一個位置去找操作系統。

主引導記錄由三個部分組成:

  (1) 第1-446字節:調用操作系統的機器碼。

  (2) 第447-510字節:分區表(Partition table)。

  (3) 第511-512字節:主引導記錄簽名(0x55和0xAA)。

其中,第二部分"分區表"的作用,是將硬盤分成若干個區。

2.2 分區表

硬盤分區有很多好處。考慮到每個區可以安裝不同的操作系統,"主引導記錄"因此必須知道將控制權轉交給哪個區。

分區表的長度只有64個字節,里面又分成四項,每項16個字節。所以,一個硬盤最多只能分四個一級分區,又叫做"主分區"。

每個主分區的16個字節,由6個部分組成:

  (1) 第1個字節:如果為0x80,就表示該主分區是激活分區,控制權要轉交給這個分區。四個主分區里面只能有一個是激活的。

  (2) 第2-4個字節:主分區第一個扇區的物理位置(柱面、磁頭、扇區號等等)。

  (3) 第5個字節:主分區類型。

  (4) 第6-8個字節:主分區最后一個扇區的物理位置。

  (5) 第9-12字節:該主分區第一個扇區的邏輯地址。

  (6) 第13-16字節:主分區的扇區總數。

最后的四個字節("主分區的扇區總數"),決定了這個主分區的長度。也就是說,一個主分區的扇區總數最多不超過2的32次方。

如果每個扇區為512個字節,就意味着單個分區最大不超過2TB。再考慮到扇區的邏輯地址也是32位,所以單個硬盤可利用的空間最大也不超過2TB。如果想使用更大的硬盤,只有2個方法:一是提高每個扇區的字節數,二是增加扇區總數。

三、第三階段:硬盤啟動

這時,計算機的控制權就要轉交給硬盤的某個分區了,這里又分成三種情況。

3.1 情況A:卷引導記錄

上一節提到,四個主分區里面,只有一個是激活的。計算機會讀取激活分區的第一個扇區,叫做"卷引導記錄"(Volume boot record,縮寫為VBR)。

"卷引導記錄"的主要作用是,告訴計算機,操作系統在這個分區里的位置。然后,計算機就會加載操作系統了。

3.2 情況B:擴展分區和邏輯分區

隨着硬盤越來越大,四個主分區已經不夠了,需要更多的分區。但是,分區表只有四項,因此規定有且僅有一個區可以被定義成"擴展分區"(Extended partition)。

所謂"擴展分區",就是指這個區里面又分成多個區。這種分區里面的分區,就叫做"邏輯分區"(logical partition)。

計算機先讀取擴展分區的第一個扇區,叫做"擴展引導記錄"(Extended boot record,縮寫為EBR)。它里面也包含一張64字節的分區表,但是最多只有兩項(也就是兩個邏輯分區)。

計算機接着讀取第二個邏輯分區的第一個扇區,再從里面的分區表中找到第三個邏輯分區的位置,以此類推,直到某個邏輯分區的分區表只包含它自身為止(即只有一個分區項)。因此,擴展分區可以包含無數個邏輯分區。

但是,似乎很少通過這種方式啟動操作系統。如果操作系統確實安裝在擴展分區,一般采用下一種方式啟動。

3.3 情況C:啟動管理器

在這種情況下,計算機讀取"主引導記錄"前面446字節的機器碼之后,不再把控制權轉交給某一個分區,而是運行事先安裝的"啟動管理器"(boot loader),由用戶選擇啟動哪一個操作系統。

Linux環境中,目前最流行的啟動管理器是Grub。

img

四、第四階段:操作系統

控制權轉交給操作系統后,操作系統的內核首先被載入內存。

以Linux系統為例,先載入/boot目錄下面的kernel。內核加載成功后,第一個運行的程序是/sbin/init。它根據配置文件(Debian系統是/etc/initab)產生init進程。這是Linux啟動后的第一個進程,pid進程編號為1,其他進程都是它的后代。

然后,init線程加載系統的各個模塊,比如窗口程序和網絡程序,直至執行/bin/login程序,跳出登錄界面,等待用戶輸入用戶名和密碼。

至此,全部啟動過程完成。

img

分割線:擴展知識

半年前,我寫了《計算機是如何啟動的?》,探討BIOS和主引導記錄的作用。

那篇文章不涉及操作系統,只與主板的板載程序有關。今天,我想接着往下寫,探討操作系統接管硬件以后發生的事情,也就是操作系統的啟動流程。

img

這個部分比較有意思。因為在BIOS階段,計算機的行為基本上被寫死了,程序員可以做的事情並不多;但是,一旦進入操作系統,程序員幾乎可以定制所有方面。所以,這個部分與程序員的關系更密切。

我主要關心的是Linux操作系統,它是目前服務器端的主流操作系統。下面的內容針對的是Debian發行版,因為我對其他發行版不夠熟悉。

第一步、加載內核

操作系統接管硬件以后,首先讀入 /boot 目錄下的內核文件。

img

以我的電腦為例,/boot 目錄下面大概是這樣一些文件:

  $ ls /boot
  
  config-3.2.0-3-amd64
  config-3.2.0-4-amd64
  grub
  initrd.img-3.2.0-3-amd64
  initrd.img-3.2.0-4-amd64
  System.map-3.2.0-3-amd64
  System.map-3.2.0-4-amd64
  vmlinuz-3.2.0-3-amd64
  vmlinuz-3.2.0-4-amd64
  

第二步、啟動初始化進程

內核文件加載以后,就開始運行第一個程序 /sbin/init,它的作用是初始化系統環境。

img

由於init是第一個運行的程序,它的進程編號(pid)就是1。其他所有進程都從它衍生,都是它的子進程。

第三步、確定運行級別

許多程序需要開機啟動。它們在Windows叫做"服務"(service),在Linux就叫做"守護進程"(daemon)。

init進程的一大任務,就是去運行這些開機啟動的程序。但是,不同的場合需要啟動不同的程序,比如用作服務器時,需要啟動Apache,用作桌面就不需要。Linux允許為不同的場合,分配不同的開機啟動程序,這就叫做"運行級別"(runlevel)。也就是說,啟動時根據"運行級別",確定要運行哪些程序。

img

Linux預置七種運行級別(0-6)。一般來說,0是關機,1是單用戶模式(也就是維護模式),6是重啟。運行級別2-5,各個發行版不太一樣,對於Debian來說,都是同樣的多用戶模式(也就是正常模式)。

init進程首先讀取文件 /etc/inittab,它是運行級別的設置文件。如果你打開它,可以看到第一行是這樣的:

  id:2:initdefault:
  

initdefault的值是2,表明系統啟動時的運行級別為2。如果需要指定其他級別,可以手動修改這個值。

那么,運行級別2有些什么程序呢,系統怎么知道每個級別應該加載哪些程序呢?......回答是每個運行級別在/etc目錄下面,都有一個對應的子目錄,指定要加載的程序。

  /etc/rc0.d
  /etc/rc1.d
  /etc/rc2.d
  /etc/rc3.d
  /etc/rc4.d
  /etc/rc5.d
  /etc/rc6.d
  

上面目錄名中的"rc",表示run command(運行程序),最后的d表示directory(目錄)。下面讓我們看看 /etc/rc2.d 目錄中到底指定了哪些程序。

  $ ls  /etc/rc2.d
  
  README
  S01motd
  S13rpcbind
  S14nfs-common
  S16binfmt-support
  S16rsyslog
  S16sudo
  S17apache2
  S18acpid
  ...
  

可以看到,除了第一個文件README以外,其他文件名都是"字母S+兩位數字+程序名"的形式。字母S表示Start,也就是啟動的意思(啟動腳本的運行參數為start),如果這個位置是字母K,就代表Kill(關閉),即如果從其他運行級別切換過來,需要關閉的程序(啟動腳本的運行參數為stop)。后面的兩位數字表示處理順序,數字越小越早處理,所以第一個啟動的程序是motd,然后是rpcbing、nfs......數字相同時,則按照程序名的字母順序啟動,所以rsyslog會先於sudo啟動。

這個目錄里的所有文件(除了README),就是啟動時要加載的程序。如果想增加或刪除某些程序,不建議手動修改 /etc/rcN.d 目錄,最好是用一些專門命令進行管理(參考這里這里)。

第四步、加載開機啟動程序

前面提到,七種預設的"運行級別"各自有一個目錄,存放需要開機啟動的程序。不難想到,如果多個"運行級別"需要啟動同一個程序,那么這個程序的啟動腳本,就會在每一個目錄里都有一個拷貝。這樣會造成管理上的困擾:如果要修改啟動腳本,豈不是每個目錄都要改一遍?

Linux的解決辦法,就是七個 /etc/rcN.d 目錄里列出的程序,都設為鏈接文件,指向另外一個目錄 /etc/init.d ,真正的啟動腳本都統一放在這個目錄中。init進程逐一加載開機啟動程序,其實就是運行這個目錄里的啟動腳本。

img

下面就是鏈接文件真正的指向。

  $ ls -l /etc/rc2.d
  
  README
  S01motd -> ../init.d/motd
  S13rpcbind -> ../init.d/rpcbind
  S14nfs-common -> ../init.d/nfs-common
  S16binfmt-support -> ../init.d/binfmt-support
  S16rsyslog -> ../init.d/rsyslog
  S16sudo -> ../init.d/sudo
  S17apache2 -> ../init.d/apache2
  S18acpid -> ../init.d/acpid
  ...
  

這樣做的另一個好處,就是如果你要手動關閉或重啟某個進程,直接到目錄 /etc/init.d 中尋找啟動腳本即可。比如,我要重啟Apache服務器,就運行下面的命令:

  $ sudo /etc/init.d/apache2 restart
  

/etc/init.d 這個目錄名最后一個字母d,是directory的意思,表示這是一個目錄,用來與程序 /etc/init 區分。

第五步、用戶登錄

開機啟動程序加載完畢以后,就要讓用戶登錄了。

img

一般來說,用戶的登錄方式有三種:

  (1)命令行登錄

  (2)ssh登錄

  (3)圖形界面登錄

這三種情況,都有自己的方式對用戶進行認證。

(1)命令行登錄:init進程調用getty程序(意為get teletype),讓用戶輸入用戶名和密碼。輸入完成后,再調用login程序,核對密碼(Debian還會再多運行一個身份核對程序/etc/pam.d/login)。如果密碼正確,就從文件 /etc/passwd 讀取該用戶指定的shell,然后啟動這個shell。

(2)ssh登錄:這時系統調用sshd程序(Debian還會再運行/etc/pam.d/ssh ),取代getty和login,然后啟動shell。

(3)圖形界面登錄:init進程調用顯示管理器,Gnome圖形界面對應的顯示管理器為gdm(GNOME Display Manager),然后用戶輸入用戶名和密碼。如果密碼正確,就讀取/etc/gdm3/Xsession,啟動用戶的會話。

第六步、進入 login shell

所謂shell,簡單說就是命令行界面,讓用戶可以直接與操作系統對話。用戶登錄時打開的shell,就叫做login shell。

img

Debian默認的shell是Bash,它會讀入一系列的配置文件。上一步的三種情況,在這一步的處理,也存在差異。

(1)命令行登錄:首先讀入 /etc/profile,這是對所有用戶都有效的配置;然后依次尋找下面三個文件,這是針對當前用戶的配置。

  ~/.bash_profile
  ~/.bash_login
  ~/.profile
  

需要注意的是,這三個文件只要有一個存在,就不再讀入后面的文件了。比如,要是 ~/.bash_profile 存在,就不會再讀入后面兩個文件了。

(2)ssh登錄:與第一種情況完全相同。

(3)圖形界面登錄:只加載 /etc/profile 和 /.profile。也就是說,/.bash_profile 不管有沒有,都不會運行。

第七步,打開 non-login shell

老實說,上一步完成以后,Linux的啟動過程就算結束了,用戶已經可以看到命令行提示符或者圖形界面了。但是,為了內容的完整,必須再介紹一下這一步。

用戶進入操作系統以后,常常會再手動開啟一個shell。這個shell就叫做 non-login shell,意思是它不同於登錄時出現的那個shell,不讀取/etc/profile和.profile等配置文件。

img

non-login shell的重要性,不僅在於它是用戶最常接觸的那個shell,還在於它會讀入用戶自己的bash配置文件 ~/.bashrc。大多數時候,我們對於bash的定制,都是寫在這個文件里面的。

你也許會問,要是不進入 non-login shell,豈不是.bashrc就不會運行了,因此bash 也就不能完成定制了?事實上,Debian已經考慮到這個問題了,請打開文件 ~/.profile,可以看到下面的代碼:

  if [ -n "$BASH_VERSION" ]; then
    if [ -f "$HOME/.bashrc" ]; then
      . "$HOME/.bashrc"
    fi
  fi
  

上面代碼先判斷變量 $BASH_VERSION 是否有值,然后判斷主目錄下是否存在 .bashrc 文件,如果存在就運行該文件。第三行開頭的那個點,是source命令的簡寫形式,表示運行某個文件,寫成"source ~/.bashrc"也是可以的。

因此,只要運行~/.profile文件,~/.bashrc文件就會連帶運行。但是上一節的第一種情況提到過,如果存在~/.bash_profile文件,那么有可能不會運行~/.profile文件。解決這個問題很簡單,把下面代碼寫入.bash_profile就行了。

  if [ -f ~/.profile ]; then
    . ~/.profile
  fi
  

這樣一來,不管是哪種情況,.bashrc都會執行,用戶的設置可以放心地都寫入這個文件了。

Bash的設置之所以如此繁瑣,是由於歷史原因造成的。早期的時候,計算機運行速度很慢,載入配置文件需要很長時間,Bash的作者只好把配置文件分成了幾個部分,階段性載入。系統的通用設置放在 /etc/profile,用戶個人的、需要被所有子進程繼承的設置放在.profile,不需要被繼承的設置放在.bashrc。

順便提一下,除了Linux以外, Mac OS X 使用的shell也是Bash。但是,它只加載.bash_profile,然后在.bash_profile里面調用.bashrc。而且,不管是ssh登錄,還是在圖形界面里啟動shell窗口,都是如此。

img

--轉自阮一峰博客,侵刪。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM