GCC 編譯詳解


GNU CC(簡稱為Gcc)是GNU項目中符合ANSI C標准的編譯系統,能夠編譯用C、C++和Object C等語言編寫的程序。Gcc不僅功能強大,而且可以編譯如C、C++、Object C、Java、Fortran、Pascal、Modula-3和Ada等多種語言,而且Gcc又是一個交叉平台編譯器,它能夠在當前CPU平台上為多種不同體系結構的硬件平台開發軟件,因此尤其適合在嵌入式領域的開發編譯。本章中的示例,除非特別注明,否則均采用Gcc版本為4.0.0。

 

GCC入門基礎

表3.6 Gcc所支持后綴名解釋

后 綴 名

所對應的語言

后 綴 名

所對應的語言

.c

C原始程序

.s/.S

匯編語言原始程序

.C/.cc/.cxx

C++原始程序

.h

預處理文件(頭文件)

.m

Objective-C原始程序

.o

目標文件

.i

已經過預處理的C原始程序

.a/.so

編譯后的庫文件

.ii

已經過預處理的C++原始程序

   

如本章開頭提到的,Gcc的編譯流程分為了四個步驟,分別為:

· 預處理(Pre-Processing)

· 編譯(Compiling)

· 匯編(Assembling)

· 鏈接(Linking)

 

下面就具體來查看一下Gcc是如何完成四個步驟的。

首先,有以下hello.c源代碼

#include<stdio.h>

int main()
{
    printf("Hello! This is our embedded world!n");

    return 0;
}

 

(1)預處理階段

在該階段,編譯器將上述代碼中的stdio.h編譯進來,並且用戶可以使用Gcc的選項”-E”進行查看,該選項的作用是讓Gcc在預處理結束后停止編譯過程。

 

注意

Gcc指令的一般格式為:Gcc [選項] 要編譯的文件 [選項] [目標文件]

其中,目標文件可缺省,Gcc默認生成可執行的文件,命為:編譯文件.out

 

[root@localhost Gcc]# Gcc –E hello.c –o hello.i

在此處,選項”-o”是指目標文件,由表3.6可知,”.i”文件為已經過預處理的C原始程序。以下列出了hello.i文件的部分內容:

typedef int (*__gconv_trans_fct) (struct __gconv_step *,

struct __gconv_step_data *, void *,

__const unsigned char *,

__const unsigned char **,

__const unsigned char *, unsigned char **,

size_t *);

…

# 2 "hello.c" 2

int main()
{
    printf("Hello! This is our embedded world!n");

    return 0;
}

由此可見,Gcc確實進行了預處理,它把”stdio.h”的內容插入到hello.i文件中。

 

(2)編譯階段

接下來進行的是編譯階段,在這個階段中,Gcc首先要檢查代碼的規范性、是否有語法錯誤等,以確定代碼的實際要做的工作,在檢查無誤后,Gcc把代碼翻譯成匯編語言。用戶可以使用”-S”選項來進行查看,該選項僅編譯到匯編語言,不進行匯編和鏈接,生成匯編代碼。

[root@localhost Gcc]# Gcc –S hello.i –o hello.s

以下列出了hello.s的內容,可見Gcc已經將其轉化為匯編了,感興趣的讀者可以分析一下這一行簡單的C語言小程序是如何用匯編代碼實現的。

.file "hello.c"

.section .rodata

.align 4

.LC0:

.string"Hello! This is our embedded world!"

.text

.globl main

.type main, @function

main:

pushl �p

movl %esp, �p

subl $8, %esp

andl $-16, %esp

movl $0, �x

addl $15, �x

addl $15, �x

shrl $4, �x

sall $4, �x

subl �x, %esp

subl $12, %esp

pushl $.LC0

call puts

addl $16, %esp

movl $0, �x

leave

ret

.size main, .-main

.ident "GCC: (GNU) 4.0.0 20050519 (Red Hat 4.0.0-8)"

.section .note.GNU-stack,"",@progbits

 

(3)匯編階段

匯編階段是把編譯階段生成的”.s”文件轉成目標文件,讀者在此可使用選項”-c”就可看到匯編代碼已轉化為”.o”的二進制目標代碼了。如下所示:

[root@localhost Gcc]# Gcc –c hello.s –o hello.o

 

(4)鏈接階段

在成功編譯之后,就進入了鏈接階段。在這里涉及到一個重要的概念:函數庫。

讀者可以重新查看這個小程序,在這個程序中並沒有定義”printf”的函數實現,且在預編譯中包含進的”stdio.h”中也只有該函數的聲明,而沒有定義函數的實現,那么,是在哪里實現”printf”函數的呢?最后的答案是:系統把這些函數實現都被做到名為libc.so.6的庫文件中去了,在沒有特別指定時,Gcc會到系統默認的搜索路徑”/usr/lib”下進行查找,也就是鏈接到libc.so.6庫函數中去,這樣就能實現函數”printf”了,而這也就是鏈接的作用。

函數庫一般分為靜態庫和動態庫兩種。靜態庫是指編譯鏈接時,把庫文件的代碼全部加入到可執行文件中,因此生成的文件比較大,但在運行時也就不再需要庫文件了。其后綴名一般為”.a”。動態庫與之相反,在編譯鏈接時並沒有把庫文件的代碼加入到可執行文件中,而是在程序執行時由運行時鏈接文件加載庫,這樣可以節省系統的開銷。動態庫一般后綴名為”.so”,如前面所述的libc.so.6就是動態庫。Gcc在編譯時默認使用動態庫。

完成了鏈接之后,Gcc就可以生成可執行文件,如下所示:

[root@localhost Gcc]# Gcc hello.o –o hello

運行該可執行文件,出現正確的結果如下:

[root@localhost Gcc]# ./hello

Hello! This is our embedded world!

 

Gcc編譯選項分析

Gcc有超過100個的可用選項,主要包括總體選項、告警和出錯選項、優化選項和體系結構相關選項。以下對每一類中最常用的選項進行講解。

 

(1)總體選項

Gcc的總結選項如表3.7所示,很多在前面的示例中已經有所涉及。

表3.7 Gcc總體選項列表

后綴名

所對應的語言

-c

只是編譯不鏈接,生成目標文件“.o”

-S

只是編譯不匯編,生成匯編代碼

-E

只進行預編譯,不做其他處理

-g

在可執行程序中包含標准調試信息

-o file

把輸出文件輸出到file里

-v

打印出編譯器內部編譯各過程的命令行信息和編譯器的版本

-I dir

在頭文件的搜索路徑列表中添加dir目錄

-L dir

在庫文件的搜索路徑列表中添加dir目錄

-static

鏈接靜態庫

-llibrary

連接名為library的庫文件

 

對於“-c”、“-E”、“-o”、“-S”選項在前一小節中已經講解了其使用方法,在此主要講解另外兩個非常常用的庫依賴選項“-I dir”和“-L dir”。

· “-I dir”

正如上表中所述,“-I dir”選項可以在頭文件的搜索路徑列表中添加dir目錄。由於Linux中頭文件都默認放到了“/usr/include/”目錄下,因此,當用戶希望添加放置在其他位置的頭文件時,就可以通過“-I dir”選項來指定,這樣,Gcc就會到相應的位置查找對應的目錄。

比如在“/root/workplace/Gcc”下有兩個文件:

#include<my.h>

int main()
{
    printf(“Hello!!n”);

    return 0;
}

#include<stdio.h>

這樣,就可在Gcc命令行中加入“-I”選項:

[root@localhost Gcc] Gcc hello1.c –I /root/workplace/Gcc/ -o hello1

這樣,Gcc就能夠執行出正確結果。

 

小知識

在include語句中,“<>”表示在標准路徑中搜索頭文件,““””表示在本目錄中搜索。故在上例中,可把hello1.c的“#include<my.h>”改為“#include “my.h””,就不需要加上“-I”選項了。

 

· “-L dir”

選項“-L dir”的功能與“-I dir”類似,能夠在庫文件的搜索路徑列表中添加dir目錄。例如有程序hello_sq.c需要用到目錄“/root/workplace/Gcc/lib”下的一個動態庫libsunq.so,則只需鍵入如下命令即可:

[root@localhost Gcc] Gcc hello_sq.c –L /root/workplace/Gcc/lib –lsunq –o hello_sq

需要注意的是,“-I dir”和“-L dir”都只是指定了路徑,而沒有指定文件,因此不能在路徑中包含文件名。

另外值得詳細解釋一下的是“-l”選項,它指示Gcc去連接庫文件libsunq.so。由於在Linux下的庫文件命名時有一個規定:必須以lib三個字母開頭。因此在用-l選項指定鏈接的庫文件名時可以省去lib三個字母。也就是說Gcc在對”-lsunq”進行處理時,會自動去鏈接名為libsunq.so的文件。

 

(2)告警和出錯選項

Gcc的告警和出錯選項如表3.8所示。

表3.8 Gcc總體選項列表

選項

含義

-ansi

支持符合ANSI標准的C程序

-pedantic

允許發出ANSI C標准所列的全部警告信息

選項

含義

-pedantic-error

允許發出ANSI C標准所列的全部錯誤信息

-w

關閉所有告警

-Wall

允許發出Gcc提供的所有有用的報警信息

-werror

把所有的告警信息轉化為錯誤信息,並在告警發生時終止編譯過程

 

下面結合實例對這幾個告警和出錯選項進行簡單的講解。

如有以下程序段:

#include<stdio.h>

void main()
{
    long long tmp = 1;

    printf(“This is a bad code!n”);

    return 0;
}

這是一個很糟糕的程序,讀者可以考慮一下有哪些問題?

 

· “-ansi”

該選項強制Gcc生成標准語法所要求的告警信息,盡管這還並不能保證所有沒有警告的程序都是符合ANSI C標准的。運行結果如下所示:

[root@localhost Gcc]# Gcc –ansi warning.c –o warning

warning.c: 在函數“main”中:

warning.c:7 警告:在無返回值的函數中,“return”帶返回值

warning.c:4 警告:“main”的返回類型不是“int”

=====>可以看出,該選項並沒有發現”long long”這個無效數據類型的錯誤。

 

· “-pedantic”

允許發出ANSI C標准所列的全部警告信息,同樣也保證所有沒有警告的程序都是符合ANSI C標准的。其運行結果如下所示:

[root@localhost Gcc]# Gcc –pedantic warning.c –o warning

warning.c: 在函數“main”中:

warning.c:5 警告:ISO C90不支持“long long”

warning.c:7 警告:在無返回值的函數中,“return”帶返回值

warning.c:4 警告:“main”的返回類型不是“int”

=====>可以看出,使用該選項查看出了”long long”這個無效數據類型的錯誤。

 

· “-Wall”

允許發出Gcc能夠提供的所有有用的報警信息。該選項的運行結果如下所示:

[root@localhost Gcc]# Gcc –Wall warning.c –o warning

warning.c:4 警告:“main”的返回類型不是“int”

warning.c: 在函數”main”中:

warning.c:7 警告:在無返回值的函數中,”return”帶返回值

warning.c:5 警告:未使用的變量“tmp”

=====>使用“-Wall”選項找出了未使用的變量tmp,但它並沒有找出無效數據類型的錯誤。

 

.“-Wextra”

我們使用-Wall選項並不能輸出所有的警告信息,如下面的警告信息會被忽略,可以使用Wextra來指定顯示額外的信息:

  • 忘記參數類型
  • 指針與整數零的邏輯比較
  • 有歧義的虛基類

.“-Wshadow”
當局部變量遮蔽(shadow)了參數、全局變量或者是其他局部變量時,該警告選項會給我們以警告信息。

另外,Gcc還可以利用選項對單獨的常見錯誤分別指定警告,有關具體選項的含義感興趣的讀者可以查看Gcc手冊進行學習。

 

.“-Wcomment”
當'/*'出現在 '/* ... */'注釋中,或者'\'出現在'// ...'注釋結尾處時,使用-Wcomment會給出警告。

#include <stdio.h>

int main()
{
   int      a        = 1;
   int      b        = 2;
   int      c        = 0; // ok just test\
   c = a + b;

  /*
    * 這里我們期待c = 3
    * /* 但實際上輸出c = 0
    */ printf(
"the c is %d\n", c); return 0; }

[root@localhost Gcc]# Gcc –Wcomment warning.c –o warning

輸出:
the c is 0

 

(3)優化選項

Gcc可以對代碼進行優化,它通過編譯選項“-On”來控制優化代碼的生成,其中n是一個代表優化級別的整數。對於不同版本的Gcc來講,n的取值范圍及其對應的優化效果可能並不完全相同,比較典型的范圍是從0變化到2或3。

不同的優化級別對應不同的優化處理工作。如使用優化選項“-O”主要進行線程跳轉(Thread Jump)和延遲退棧(Deferred Stack Pops)兩種優化。使用優化選項“-O2”除了完成所有“-O1”級別的優化之外,同時還要進行一些額外的調整工作,如處理器指令調度等。選項“-O3”則還包括循環展開和其他一些與處理器特性相關的優化工作。

雖然優化選項可以加速代碼的運行速度,但對於調試而言將是一個很大的挑戰。因為代碼在經過優化之后,原先在源程序中聲明和使用的變量很可能不再使用,控制流也可能會突然跳轉到意外的地方,循環語句也有可能因為循環展開而變得到處都有,所有這些對調試來講都將是一場噩夢。所以筆者建議在調試的時候最好不使用任何優化選項,只有當程序在最終發行的時候才考慮對其進行優化。

 

(4)體系結構相關選項

Gcc的體系結構相關選項如表3.9所示。

表3.9Gcc體系結構相關選項列表

選項

含義

-mcpu=type

針對不同的CPU使用相應的CPU指令。可選擇的type有i386、i486、pentium及i686等

-mieee-fp

使用IEEE標准進行浮點數的比較

-mno-ieee-fp

不使用IEEE標准進行浮點數的比較

-msoft-float

輸出包含浮點庫調用的目標代碼

-mshort

把int類型作為16位處理,相當於short int

-mrtd

強行將函數參數個數固定的函數用ret NUM返回,節省調用函數的一條指令

這些體系結構相關選項在嵌入式的設計中會有較多的應用,讀者需根據不同體系結構將對應的選項進行組合處理。在本書后面涉及到具體實例會有針對性的講解。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM