gcc/g++等編譯器編譯原理：預處理，編譯，匯編，鏈接各步驟詳解

本文轉載自查看原文 2016-06-11 19:22 4102 gcc

摘自http://blog.csdn.net/elfprincexu/article/details/45043971

gcc/g++等編譯器編譯原理：預處理，編譯，匯編，鏈接各步驟詳解

C和C++編譯器是集成的，編譯一般分為四個步驟：

預處理(preprocessing) ----------------- cpp/ gcc -E
編譯(compilation) ------------------ cc1 / gcc -S
匯編(assembly) -------------------- as
連接(linking) --------------------- ld

gcc

　　認為預處理的文件是(.i)是C文件，並且設定C形式的連接；

g++

　　認為預處理的文件是(.i)是C++文件，並且設定C++形式的連接；

源文件后綴名的一些含義和后續的操作：

.c　　　　　　 C源程序　　　　　　　　預處理，編譯，匯編
.C　　　　　　C++源程序　　　　　　預處理，編譯，匯編
.cc　　　　　 C++源程序　　
.cxx 　　　　 C++源程序　　　　　　預處理，編譯，匯編
.m 　　　　　 Objective-C源程序　　　預處理，編譯，匯編
.i 　　　　　　預處理后的C文件　　　　編譯，匯編
.ii　　　　　　預處理后的C++文件　　　編譯，匯編
.s　　　　　　匯編語言源程序　　　　　匯編
.S　　　　　　匯編語言源程序　　　　　預處理，匯編
.h　　　　　　預處理器文件　　　　　　通常不出現在命令行上

其他后綴名的文件被傳遞給連接器(linker).通常包括:

　　.o 目標文件(Object file)

　　.a 歸檔庫文件(Archive file)

轉載請注明出處： http://blog.csdn.net/elfprincexu

二、具體介紹一下GCC編譯步驟

首先，有以下hello.c源代碼

[cpp] view plain copy

print ?

#include<stdio.h>
int main()
{
printf("Hello! This is our embedded world!\n");
return 0;
}

（1）預處理階段

在該階段，編譯器將上述代碼中的stdio.h編譯進來，並且用戶可以使用Gcc的選項”-E”進行查看，該選項的作用是讓Gcc在預處理結束后停止編譯過程。預處理階段主要處理#include和#define，它把#include包含進來的.h 文件插入到#include所在的位置，把源程序中使用到的用#define定義的宏用實際的字符串代替，我們可以用-E選項要求gcc只進行預處理而不進行后面的三個階段，

注意： Gcc指令的一般格式為：Gcc [選項] 要編譯的文件 [選項] [目標文件]

其中，目標文件可缺省，Gcc默認生成可執行的文件，命為：編譯文件.out

[root@localhost Gcc]# Gcc –E hello.c –o hello.i

在此處，選項"-o"是指目標文件，".i"文件為已經過預處理的C原始程序。以下列出了hello.i文件的部分內容：

[cpp] view plain copy

print ?

typedef int (*__gconv_trans_fct) (struct __gconv_step *,
struct __gconv_step_data *, void *,
__const unsigned char *,
__const unsigned char **,
__const unsigned char *, unsigned char **,
size_t *);
…
# 2 "hello.c" 2
int main()
{
printf("Hello! This is our embedded world!\n");
return 0;
}

由此可見，Gcc確實進行了預處理，它把”stdio.h”的內容插入到hello.i文件中。

（2）編譯階段

接下來進行的是編譯階段，在這個階段中，Gcc首先要檢查代碼的規范性、是否有語法錯誤等，以確定代碼的實際要做的工作，在檢查無誤后，Gcc把代碼翻譯成匯編語言。用戶可以使用”-S”選項來進行查看，該選項只進行編譯而不進行匯編，生成匯編代碼。

編譯階段是最重要的階段，在這個階段GCC首先檢查語法然后把由上步生成的*.i編譯成*.s文件。我們可以用如下命令告訴gcc進行這一步處理，gcc -S hello.i -o hello.s，-S選項告訴gcc把hello.i編譯成.s文件；

上面這兩步的輸出文件都是文本文件，我們可以用諸如cat的文本處理等命令閱讀這些輸出文件。

這個階段可以接收.c和.i類型的文件

[root@localhost Gcc]# Gcc –S hello.i –o hello.s

以下列出了hello.s的內容，可見Gcc已經將其轉化為匯編了，感興趣的讀者可以分析一下這一行簡單的C語言小程序是如何用匯編代碼實現的。

[cpp] view plain copy

print ?

.file "hello.c"
.section .rodata
.align 4
.LC0:
.string "Hello! This is our embedded world!"
.text
.globl main
.type main, @function
main:
pushl %ebp
movl %esp, %ebp
subl $8, %esp
andl $-16, %esp
movl $0, %eax
addl $15, %eax
addl $15, %eax
shrl $4, %eax
sall $4, %eax
subl %eax, %esp
subl $12, %esp
pushl $.LC0
call puts
addl $16, %esp
movl $0, %eax
leave
ret
.size main, .-main
.ident "GCC: (GNU) 4.0.0 20050519 (Red Hat 4.0.0-8)"
.section .note.GNU-stack,"",@progbits

（3）匯編階段

匯編階段把*.s文件翻譯成二進制機器指令文件*.o，如命令gcc -c hello.s -o hello.o，其中-c告訴gcc進行匯編處理。這步生成的文件是二進制文件，直接用文本工具打開看到的將是亂碼，我們需要反匯編工具如GDB的幫助才能讀懂它；

這個階段接收.c, .i, .s的文件都沒有問題。比如gcc -c hello.i -o hello.o等

匯編階段是把編譯階段生成的”.s”文件轉成目標文件，讀者在此可使用選項”-c”就可看到匯編代碼已轉化為”.o”的二進制目標代碼了。如下所示：

[root@localhost Gcc]# Gcc –c hello.s –o hello.o

（4）鏈接階段

在成功編譯之后，就進入了鏈接階段。在這里涉及到一個重要的概念：函數庫。

讀者可以重新查看這個小程序，在這個程序中並沒有定義”printf”的函數實現，且在預編譯中包含進的”stdio.h”中也只有該函數的聲明，而沒有定義函數的實現，那么，是在哪里實現”printf”函數的呢？最后的答案是：系統把這些函數實現都被做到名為libc.so.6的庫文件中去了，在沒有特別指定時，Gcc會到系統默認的搜索路徑”/usr/lib”下進行查找，也就是鏈接到libc.so.6庫函數中去，這樣就能實現函數”printf”了，而這也就是鏈接的作用。

函數庫一般分為靜態庫和動態庫兩種。

靜態庫是指編譯鏈接時，把庫文件的代碼全部加入到可執行文件中，因此生成的文件比較大，但在運行時也就不再需要庫文件了。其后綴名一般為”.a”。
動態庫與之相反，在編譯鏈接時並沒有把庫文件的代碼加入到可執行文件中，而是在程序執行時由運行時鏈接文件加載庫，這樣可以節省系統的開銷。動態庫一般后綴名為”.so”，如前面所述的libc.so.6就是動態庫。Gcc在編譯時默認使用動態庫。

[cpp] view plain copy

print ?

說下生成靜態庫的方法：
ar cr libxxx.a file1.o file2.o
就是把file1.o和file2.o打包生成libxxx.a靜態庫
使用的時候
gcc test.c -L/path -lxxx -o test
動態庫的話：
gcc -fPIC -shared file1.c -o libxxx.so
也可以分成兩部來寫：
gcc -fPIC file1.c -c //這一步生成file1.o
gcc -shared file1.o -o libtest.so

效果是一樣的。

用的時候和上面的靜態庫的用法一樣

但是到了運行程序的時候，需要指定動態庫的位置，可以環境變量來指定

export LD_LIBRARY_PATH=path，否則會提示找不到動態庫的位置

由於鏈接動態庫和靜態庫的時候使用的方法是一樣的，所以如果在庫中有同名的靜態庫文件和動態庫文件，比如libtest.a和libtest.so，根據gcc鏈接時默認優先選擇動態庫，會鏈接libtest.so，如果想要讓gcc選擇鏈接libtest.a那么需要指定一個選項，就是-static,這樣就會強制gcc找靜態庫文件了。

靜態庫鏈接時搜索路徑順序：

1. ld會去找GCC命令中的參數-L
2. 再找gcc的環境變量LIBRARY_PATH
3. 再找內定目錄 /lib /usr/lib /usr/local/lib 這是當初compile gcc時寫在程序內的

動態鏈接時、執行時搜索路徑順序:

1. 編譯目標代碼時指定的動態庫搜索路徑
2. 環境變量LD_LIBRARY_PATH指定的動態庫搜索路徑
3. 配置文件/etc/ld.so.conf中指定的動態庫搜索路徑
4. 默認的動態庫搜索路徑/lib
5. 默認的動態庫搜索路徑/usr/lib

有關環境變量：

LIBRARY_PATH環境變量：指定程序靜態鏈接庫文件搜索路徑
LD_LIBRARY_PATH環境變量：指定程序動態鏈接庫文件搜索路徑

完成了鏈接之后，Gcc就可以生成可執行文件，如下所示。

[root@localhost Gcc]# Gcc hello.o –o hello

運行該可執行文件，出現正確的結果如下。

[root@localhost Gcc]# ./hello

Hello! This is our embedded world!

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Linux 之編譯器 gcc/g++參數詳解 GCC編譯器原理（三）------編譯原理三：編譯過程---預處理 GCC編譯的背后( 預處理和編譯匯編和鏈接 ) Ubuntu 安裝不同版本的 gcc/g++ 編譯器 (gcc/g++）/clang/cl編譯器升級樹莓派的gcc/g++編譯器到4.8 Linux下安裝gcc 、g++ 、gfortran編譯器 gcc/g++編譯器的安裝與說明編譯器 cc、gcc、g++、CC 的區別 cmake指定gcc/g++編譯器版本