要理解.c文件與.h文件有什么不同之處,首先需要弄明白編譯器的工作過程,一般說來編譯器會做以下幾個過程: 1.預處理階段 2.詞法與語法分析階段 3.編譯階段,首先編譯成純匯編語句,再將之匯編成跟CPU相關的二進制碼,生成各個目標文件 4.連接階段,將各個目標文件中的各段代碼進行絕對地址定位,生成跟特定平台相關的可執行文件,當然,最后還可以用objcopy生成純二進制碼,也就是去掉了文件格式信息
編譯器在編譯時是以c文件為單位進行的,也就是說如果你的項目中一個c文件都沒有,那么你的項目將無法編譯,連接器是以目標文件為單位,它將一個或多個目 標文件進行函數與變量的重定位,生成最終的可執行文件,在PC上的程序開發,一般都有一個main函數,這是各個編譯器的約定,當然,你如果自己寫連接器 腳本的話,可以不用main函數作為程序入口!!!!
有了這些基礎知識,再言歸正傳,為了生成一個最終的可執行文件,就需要一些目標文件,也就是需要C文件,而這些C文件中又需要一個main函數作為可執行程序的入口,那么我們就從一個C文件入手,假定這個C文件內容如下: #include <stdio.h> #include "mytest.h"
int main(int argc,char **argv) { test = 25; printf("test.................%d\n",test); }
mytest.h文件內容如下: int test;
現在以這個例子來講解編譯器的工作: 1.預處理階段:編譯器以C文件作為一個單元,首先讀這個C文件,發現第一句與第二句是包含.h文件,就會在所有搜索路徑中尋找這兩個文件,找到之后,就 會將相應.h文件中再去處理宏,變量,函數聲明,嵌套的.h文件包含等,檢測依賴關系,進行宏替換,看是否有重復定義與聲明的情況發生,最后將那些文件中 所有的東東全部掃描進這個當前的C文件中,形成一個中間“C文件”
2.編譯階段,在上一步中相當於將那個.h文件中的test變量掃描進了一個中間C文件,那么test變量就變成了這個文件中的一個全局變量,此時,就將 所有這個中間C文件的所有變量,函數分配空間,將各個函數編譯成二進制碼,按照特定目標文件格式生成目標文件,在這種格式的目標文件中進行各個全局變量, 函數的符號描述,將這些二進制碼按照一定的標准組織成一個目標文件
3.連接階段,將上一步成生的各個目標文件,根據一些參數,連接生成最終的可執行文件,主要的工作就是重定位各個目標文件的函數,變量等,相當於將個目標文件中的二進制碼按一定的規范合到一個文件中
再回到c文件與h文件各寫什么內容的話題上: 理論上來說C文件與h文件里的內容,只要是C語言所支持的,無論寫什么都可以的,比如你在h文件中寫函數體,只要在任何一個C文件包含此.h文件就可以將 這個函數編譯成目標文件的一部分(編譯是以C文件為單位的,如果不在任何C文件中包含此.h文件的話,這段代碼就形同虛設),你可以在C文件中進行函數聲 明,變量聲明,結構體聲明,這也不成問題!!!那為何一定要分成h文件與C文件呢?又為何一般都在h文件中進行函數,變量聲明,宏聲明,結構體聲明呢?而 在C文件中去進行變量定義,函數實現呢??原因如下:
1.如果在h文件中實現一個函數體,那么如果在多個C文件中引用它,而且又同時編譯多個C文件,將其生成的目標文件連接成一個可執行文件,在每個引用此h 文件的C文件所生成的目標文件中,都有一份這個函數的代碼,如果這段函數又沒有定義成局部函數,那么在連接時,就會發現多個相同的函數,就會報錯
2.如果在h文件中定義全局變量,並且將此全局變量賦初值,那么在多個引用此h文件的C文件中同樣存在相同變量名的拷貝,關鍵是此變量被賦了初值,所以編 譯器就會將此變量放入DATA段,最終在連接階段,會在DATA段中存在多個相同的變量,它無法將這些變量統一成一個變量,也就是僅為此變量分配一個空 間,而不是多份空間,假定這個變量在h文件沒有賦初值,編譯器就會將之放入BSS段,連接器會對BSS段的多個同名變量僅分配一個存儲空間
3.如果在C文件中聲明宏,結構體,函數等,那么我要在另一個C文件中引用相應的宏,結構體,就必須再做一次重復的工作,如果我改了一個C文件中的一個聲 明,那么又忘了改其它C文件中的聲明,這不就出了大問題了,程序的邏輯就變成了你不可想象的了,如果把這些公共的東東放在一個頭文件中,想用它的C文件就 只需要引用一個就OK了!!!這樣豈不方便,要改某個聲明的時候,只需要動一下h文件就行了
4.在h文件中聲明結構體,函數等,當你需要將你的代碼封裝成一個庫,讓別人來用你的代碼,你又不想公布源碼,那么人家如何利用你的庫呢?也就是如何利用 你的庫中的各個函數呢??一種方法是公布源碼,別人想怎么用就怎么用,另一種是提供頭文件,別人從頭文件中看你的函數原型,這樣人家才知道如何調用你寫的 函數,就如同你調用printf函數一樣,里面的參數是怎樣的??你是怎么知道的??還不是看人家的頭文件中的相關聲明啊!!!當然這些東東都成了C標 准,就算不看人家的頭文件,你一樣可以知道怎么使用
例子: //a.h void foo(); //a.c #include "a.h" //我的問題出來了:這句話是要,還是不要? void foo() { return; }
//main.c #include "a.h" int main(int argc, char *argv[]) { foo(); return 0; }
針對上面的代碼,請回答三個問題: 1.a.c 中的#include "a.h" 這句話是不是多余的?為什么經常見xx.c 里面include 對應的xx.h? 2.如果a.c 中不寫,那么編譯器是不是會自動把.h 文件里面的東西跟同名的.c 文件綁定在一起? 3.第三個問題我給他改了一下:如果a.c 中不寫include<>,那么編譯器是不是會自動把.h 文件里面的東西跟同名的.c文件綁定在一起?
下面是一位牛人的原話:
從C編譯器角度看,.h和.c皆是浮雲,就是改名為.txt、.doc也沒有大的分別。換句話說,就是.h和.c沒啥必然聯系。.h中一般放的是同名.c文件中定義的變量、數組、函數的聲明,需要讓.c外部使用的聲明。這個聲明有啥用?只是讓需要用這些聲明的地方方便引用。因為#include "xx.h" 這個宏其實際意思就是把當前這一行刪掉,把xx.h 中的內容原封不動的插入在當前行的位置。由於想寫這些函數聲明的地方非常多(每一個調用xx.c 中函數的地方,都要在使用前聲明一下子),所以用#include "xx.h" 這個宏就簡化了許多行代碼——讓預處理器自己替換好了。也就是說,xx.h 其實只是讓需要寫xx.c 中函數聲明的地方調用(可以少寫幾行字),至於include 這個.h 文件是誰,是.h 還是.c,還是與這個.h 同名的.c,都沒有任何必然關系。 這樣你可能會說:啊?那我平時只想調用xx.c 中的某個函數,卻include了xx.h 文件,豈不是宏替換后出現了很多無用的聲明?沒錯,確實引入了很多垃圾 ,但是它卻省了你不少筆墨,並且整個版面也看起來清爽的多。魚與熊掌不可得兼,就是這個道理。反正多些聲明(.h一般只用來放聲明,而放不定義,參見拙著“過馬路,左右看”)也無害處,又不會影響編譯,何樂而不為呢? 翻回頭再看上面的3個問題,很好解答了吧?
它的解答如下: 1.不一定。這個例子中顯然是多余的。但是如果.c中的函數也需要調用同個.c中的其它函數,那么這個.c往往會include同名的.h,這樣就不需要為聲明和調用順序而發愁了(C語言要求使用之前必須聲明,而include同名.h一般會放在.c的開頭)。有很多工程甚至把這種寫法約定為代碼規范,以規范出清晰的代碼來。 2.答:1中已經回答過了。 3.答:不會。問這個問題的人絕對是概念不清,要不就是想混水摸魚。非常討厭的是中國的很多考試出的都是這種爛題,生怕別人有個清楚的概念了,絕對要把考生搞暈。
補充一下:
一個程序僅有一個H文件,沒有C文件,可以嗎?
答案是肯定的,不可以!在VC6.0下可以看到編譯按鈕的顏色!變灰,表示無法編譯。
