轉載自:http://blog.csdn.net/chengocean/article/details/6250779
C源程序-->預編譯處理(.c)-->編譯、優化程序(.s、.asm)-->匯編程序(.obj、.o、.a、.ko)-->鏈接程序(.exe、.elf、.axf等)。
1. C源程序
2. 預編譯處理(.c)
它主要包括四個過程
a、宏定義指令,如#define N 6,#undef等。
對於前一個偽指令,預編譯所要做的是將程序中的所有N用6替換,請大家注意這里是替換,並不是像作為函數參數那樣將6復制進N這個變量。對於后者,則將取消對某個宏的定義,使以后出現的N不再被替換。
b、條件編譯指令,如#ifdef,#ifndef,#endif等。
這些偽指令的引入使得程序員可以通過定義不同的宏來決定編譯程序對哪些代碼進行處理。預編譯程序將根據有關的文件,將那些不必要的代碼過濾掉。這樣就能在編譯階段減少編譯時間,提高效率,看看這是多好的指令。O(∩_∩)O~
c、頭文件包含指令,如#include "file.h"或#include <file.h>等。
在頭文件中一般用偽指令#define定義了大量的宏(最常見的是字符常量),同時包含有各種外部符號的聲明。
采用這樣的做法一來可以讓我們直接調用一些復雜庫函數;二來可以免去我們在寫程序時重復做一些定義聲明工作的麻煩。試想一下,一旦我們寫好頭文件,那么以后要用到相關模塊就再也不用寫這些函數了,直接#include 就OK了,這可是一勞永逸啊。
#include<>:這條指令就是告訴編譯器去系統默認的路徑尋找相關文件。
#include”” :這條是告訴編譯器先去源程序所在目錄下尋找,如果沒有就去系統默認路徑尋找。
d、特殊符號,預編譯程序可以識別一些特殊的符號。
例如在源程序中出現的LINE標識將被解釋為當前行號(十進制數),FILE則被解釋為當前被編譯的C源程序的名稱。預編譯程序就是對在源程序中出現的這些特殊符號將用合適的值進行替換大家注意到沒,預編譯階段基本上是完成對源程序的相關代碼進行替換,這樣之后程序的原意沒有改變,就是代碼的內容有所不同,這樣為以后的編譯做好准備,ok,第二階段完滿結束,嘿嘿!
3. 編譯、優化程序(.s、.asm)
經過上一階段的處理,現在我們的程序已經沒有宏定義,包含頭文件等指令了,只剩下一些變量,常量,關鍵字等,而編譯的主要作用是檢查這些代碼的語法錯誤及將這些代碼編譯成為匯編文件。
優化程序這是很復雜的,不僅和編譯技術本身有關,還和目標板相應的硬件環境有很大的關系。如下面的代碼:
int a,b,c;
a = inWord(0x100); /*讀取 I/O 空間 0x100 端口的內容存入 a 變量*/
b = a;
a = inWord (0x100); /*再次讀取 I/O 空間0x100端口的內容存入 a 變量*/
c = a;
很可能被編譯器優化為:
int a,b,c;
a = inWord(0x100); /*讀取 I/O 空間 0x100 端口的內容存入 a 變量*/
b = a;
c = a;
也正是由於這種編譯器優化作用才使關鍵字volatile有了這么大的用武之地,當然這只是原因之一。
4. 匯編程序(.obj、.o、.a、.ko)
在這個階段是將匯編代碼翻譯成目標文件,這時的文件已經是二進制代碼了。在windows環境下文件的后綴名是.obj,不可執行,需要鏈接夠才可以執行;而在unix下則有是o、.a、.ko等文件。
目標文件由段組成。通常一個目標文件中至少有兩個段:
代碼段:該段中所包含的主要是程序的指令。該段一般是可讀和可執行的,但一般卻不可寫。
數據段:主要存放程序中要用到的各種全局變量或靜態的數據。一般數據段都是可讀,可寫,可執行的。
5. 鏈接程序(.exe、.elf、.axf)
也許有人會有疑問,上面的目標代碼已經是機器碼了,也就是說CPU可以識別這些文件了,那為什么我們還要鏈接程序呢?大家想想我們是不是忘了點什么。。。對!那些被包含的頭文件,以及當我們的程序分布於很多源文件時,那么這些源文件該怎么處理呢,這就是連接器的作用,它們被翻譯成目標代碼后需要被鏈接到一起才能被執行。這樣就ok了,嘿嘿!
談到函數庫的鏈接,我們還需要了解點函數庫的知識,函數庫分靜態鏈接庫(又稱靜態庫*.lib)和鏈接動態庫(又稱動態庫*.dll)。
靜態庫的鏈接在編譯時會被編譯進匯編文件,這樣的操作會改變文件大小;而動態庫則是在執行時(雙擊運行),當需要動態庫中的文件時才被鏈接到可執行文件的。