在上一講中,簡單介紹了函數的定義和使用,只要你想完成一個新功能,首先想到的應該是定義一個新的函數來完成這個功能。這講繼續介紹函數的其他用法和注意事項。
一、函數的聲明
1.在C語言中,函數的定義順序是有講究的:默認情況下,只有后面定義的函數才可以調用前面定義過的函數
1 int sum(int a, int b) { 2 return a + b; 3 } 4 5 int main() 6 { 7 int c = sum(1, 4); 8 return 0; 9 }
第5行定義的main函數調用了第1行的sum函數,這是合法的。如果調換sum函數和main函數的順序,在標准的C編譯器環境下是不合法的(不過在GCC編譯器環境下只是一個警告)
2.如果想把函數的定義寫在main函數后面,而且main函數能正常調用這些函數,那就必須在main函數的前面進行函數的聲明
1 // 只是做個函數聲明,並不用實現 2 int sum(int a, int b); 3 4 int main() 5 { 6 int c = sum(1, 4); 7 return 0; 8 } 9 10 // 函數的定義(實現) 11 int sum(int a, int b) { 12 return a + b; 13 }
在第11行定義了sum函數,在第2行對sum函數進行了聲明,然后在第6行(main函數中)就可以正常調用sum函數了。
3.函數的聲明格式
1> 格式
返回值類型 函數名 (參數1, 參數2, ...)
只要你在main函數前面聲明過一個函數,main函數就知道這個函數的存在,就可以調用這個函數。而且只要知道函數名、函數的返回值、函數接收多少個參數、每個參數是什么類型的,就能夠調用這個函數了,因此,聲明函數的時候可以省略參數名稱。比如上面的sum函數聲明可以寫成這樣:
int sum(int, int);
究竟這個函數是做什么用的,還要看函數的定義。
2> 如果只有函數的聲明,而沒有函數的定義,那么程序將會在鏈接時出錯
下面的寫法是錯誤的:
1 int sum(int a, int b); 2 3 int main() 4 { 5 6 sum(10, 11); 7 8 return 0; 9 }
- 在第1行聲明了一個sum函數,但是並沒有對sum函數進行定義,接着在第6行調用sum函數
- 這個程序是可以編譯成功的,因為我們在main函數前面聲明了sum函數(函數的聲明和定義是兩碼事),這個函數聲明可以理解為:在語法上,騙一下main函數,告訴它sum函數是存在的,所以從語法的角度上main函數是可以調用sum函數的。究竟這個sum函數存不存在呢,有沒有被定義呢?編譯器是不管的。在編譯階段,編譯器並不檢測函數有沒有定義,只有在鏈接的時候才會檢測這個函數存不存在,也就是檢測函數有沒有被定義。
- 因此,這個程序會在鏈接的時候報錯,錯誤信息如下:
- 我這里的源文件是main.c文件,所以編譯成功后生成一個main.o文件。鏈接的時候,鏈接器會檢測main.o中的函數有沒有被定義。
- 上面的錯誤信息大致意思是:在main.o文件中找不到sum這個標識符。
- 錯誤信息中的linker是鏈接器的意思,下次看到這個linker,說明是鏈接階段出錯了。鏈接出錯了,就不能生成可執行文件,程序就不能運行。
- 這個錯誤的解決方案就是加上sum函數的定義。
二、多源文件開發
1.為什么要有多個源文件
1> 在編寫第一個C程序的時候已經提到:我們編寫的所有C語言代碼都保存在拓展名為.c的源文件中,編寫完畢后就進行編譯、鏈接,最后運行程序。
2> 在前面的學習過程中,由於代碼比較少,因此所有的代碼都保存在一個.c源文件中。但是,在實際開發過程中,項目做大了,源代碼肯定非常多,很容易就上萬行代碼了,甚至上十萬、百萬都有可能。這個時候如果把所有的代碼都寫到一個.c源文件中,那么這個文件將會非常龐大,也非常惡心,你可以想象一下,一個文件有十幾萬行文字,不要說調試程序了,連閱讀代碼都非常困難。
3> 而且,公司里面都是以團隊開發為主,如果多個開發人員同時修改一個源文件,那就會帶來很多麻煩的問題,比如張三修改的代碼很有可能會抹掉李四之前添加的代碼。
4> 因此,為了模塊化開發,一般會將不同的功能寫到不同的.c源文件中,這樣的話,每個開發人員都負責修改不同的源文件,達到分工合作的目的,能夠大大提高開發效率。也就是說,一個正常的C語言項目是由多個.c源文件構成。
2.將sum函數寫到其他源文件中
接下來就演示一下多個源文件的開發,我將前面定義的sum函數寫在另一個源文件(命名為sum.c)中。這時候就有兩個源文件:
1> main.c文件
1 int main() 2 { 3 4 return 0; 5 }
2> sum.c文件
1 int sum(int a, int b) 2 { 3 return a + b; 4 }
3.在main函數中調用sum函數
1> 現在想在main函數中調用sum函數,那么你可能會直接這樣寫:
1 int main() 2 { 3 int c = sum(10, 11); 4 5 return 0; 6 }
這種寫法在標准C語言編譯器中是直接報錯的,因為main函數都不知道sum函數的存在,怎么可以調用它呢!!!
2> 我們應該騙一下main函數,sum函數是存在的,告訴它sum函數的返回值和參數類型即可。也就是說,應該在main函數前面,對sum函數進行聲明。
main.c文件應該寫成下面這樣
1 #include <stdio.h> 2 3 int sum(int, int); 4 5 int main() 6 { 7 int c = sum(10, 11); 8 9 printf("c is %d\n", c); 10 11 return 0; 12 }
注意第3行,加了一個sum函數的聲明。為了檢驗sum函數的調用結果,在第9行用prinf函數將結果輸出。
4.編譯所有的源文件
sum.c和main.c都編寫完畢后,就可以使用gcc指令進行編譯了。同時編譯兩個文件的指令是:cc -c main.c sum.c
編譯成功后,生成了2個.o目標文件
也可以單獨編譯:
cc -c main.c
cc -c sum.c
5.鏈接所有的目標文件
前面已經編譯成功,生成了main.o和sum.o文件。現在應該把這2個.o文件進行鏈接,生成可執行文件。
1> 注意,一定要同時鏈接兩個文件。如果你只是單獨鏈接main.o或者sum.o都是不可能鏈接成功的。原因如下:
- 如果只是鏈接main.o文件:cc main.o,錯誤信息是:在main.o中找到不到sum這個標識符,其實就是找不到sum函數的定義。因為sum函數的定義在sum.o文件中,main.o中只有sum函數的聲明
- 如果只是鏈接sum.o文件:cc sum.o,錯誤信息是:找不到main函數。一個C程序的入口點就是main函數,main函數定義在main.o中,sum.o中並沒有定義main函數,連入口都沒有,怎么能鏈接成功、生成可執行文件呢?
可以看出,main.o和sum.o有密不可分的關系,其實鏈接的目的就是將所有相關聯的目標文件和C語言函數庫組合在一起,生成可執行文件。
2> 鏈接main.o和sum.o文件:cc main.o sum.o,生成了可執行文件a.out
3> 運行a.out文件:./a.out,運行結果是在屏幕上輸出了:
c is 21
說明函數調用成功,我們已經成功在main.c文件的main函數中調用了sum.c文件中的sum函數
4> 從中也可以得出一個結論:只要知道某個函數的聲明,就可以調用這個函數,編譯就能成功。不過想要這個程序能夠運行成功,必須保證在鏈接的時候能找到函數的定義。
三、#include
理解完前面的知識后,接下來就可以搞懂一個很久以前的問題:每次寫在最前面的#include是干啥用的?
1.#include的作用
先來看一個最簡單的C程序:
1 #include <stdio.h> 2 3 int main() 4 { 5 printf("Hello, World!\n"); 6 return 0; 7 }
這個程序的作用是在屏幕上輸出Hello,World!這一串內容,我們主要關注第一行代碼。
- #include 是C語言的預處理指令之一,所謂預處理,就是在編譯之前做的處理,預處理指令一般以 # 開頭
- #include 指令后面會跟着一個文件名,預處理器發現 #include 指令后,就會根據文件名去查找文件,並把這個文件的內容包含到當前文件中。被包含文件中的文本將替換源文件中的 #include 指令,就像你把被包含文件中的全部內容拷貝到這個 #include 指令所在的位置一樣。所以第一行指令的作用是將stdio.h文件里面的所有內容拷貝到第一行中。
- 如果被包含的文件拓展名為.h,我們稱之為"頭文件"(Header File),頭文件可以用來聲明函數,要想使用這些函數,就必須先用 #include 指令包含函數所在的頭文件
- #include 指令不僅僅限於.h頭文件,可以包含任何編譯器能識別的C/C++代碼文件,包括.c、.hpp、.cpp等,甚至.txt、.abc等等都可以
也就是說你完全可以將第3行~第7行的代碼放到其他文件中,然后用 #include 指令包含進來,比如:
1> 將第3行~第7行的代碼放到my.txt中
2> 在main.c源文件中包含my.txt文件
- 編譯鏈接后,程序還是可以照常運行的,因為 #include 的功能就是將文件內容完全拷貝到 #include 指令所在的位置
- 說明:這里用txt文件純屬演示,平時做項目不會這樣做,除非吃飽了撐着,才會把代碼都寫到txt中去
2.#include可以使用絕對路徑
上面的#include "my.txt"使用的是相對路徑,其實也可以使用絕對路徑。比如#include "/Users/apple/Desktop/my.txt"
3.#include <>和#include ""的區別
二者的區別在於:當被include的文件路徑不是絕對路徑的時候,有不同的搜索順序。
1> 對於使用雙引號""來include文件,搜索的時候按以下順序:
- 先在這條include指令的父文件所在文件夾內搜索,所謂的父文件,就是這條include指令所在的文件
- 如果上一步找不到,則在父文件的父文件所在文件夾內搜索;
- 如果上一步找不到,則在編譯器設置的include路徑內搜索;
- 如果上一步找不到,則在系統的INCLUDE環境變量內搜索
2> 對於使用尖括號<>來include文件,搜索的時候按以下順序:
- 在編譯器設置的include路徑內搜索;
- 如果上一步找不到,則在系統的INCLUDE環境變量內搜索
我這里使用的是clang編譯器,clang設置include路徑是(4.2是編譯器版本):/usr/lib/clang/4.2/include
Mac系統的include路徑有:
- /usr/include
- /usr/local/include
4.stdio.h
我們已經知道#include指令的作用了,可是為什么要在第一行代碼包含stdio.h呢?
- stdio.h 是C語言函數庫中的一個頭文件,里面聲明了一些常用的輸入輸出函數,比如往屏幕上輸出內容的printf函數
- 這里之所以包含 stdio.h 文件,是因為在第5行中用到了在 stdio.h 內部聲明的printf函數,這個函數可以向屏幕輸出數據,第7行代碼輸出的內容是:Hello, World!
- 注意:stdio.h里面只有printf函數的聲明。前面已經提到:只要知道函數的聲明,就可以調用這個函數,就能編譯成功。不過想要這個程序能夠運行成功,必須保證在鏈接的時候能找到函數的定義。其實鏈接除了會將所有的目標文件組合在一起,還會關聯C語言的函數庫,函數庫中就有printf函數的定義。因此前面的程序是可以鏈接成功的。
5.頭文件.h和源文件.c的分工
跟printf函數一樣,我們在開發中會經常將函數的聲明和定義寫在不同的文件中,函數聲明放在.h頭文件中,函數定義放在.c源文件中。
下面我們將sum函數的聲明和定義分別放在sum.h和sum.c中
這是sum.h文件
這是sum.c文件
然后在main.c中包含sum.h即可使用sum函數
其實sum.h和sum.c的文件名不一樣要相同,可以隨便寫,只要文件名是合法的。但還是建議寫成一樣,因為一看文件名就知道sum.h和sum.c是有聯系的。
運行步驟分析:
1> 在編譯之前,預編譯器會將sum.h文件中的內容拷貝到main.c中
2> 接着編譯main.c和sum.c兩個源文件,生成目標文件main.o和sum.o,這2個文件是不能被單獨執行的,原因很簡單:
* sum.o中不存在main函數,肯定不可以被執行
* main.o中雖然有main函數,但是它在main函數中調用了一個sum函數,而sum函數的定義卻存在於sum.o中,因此main.o依賴於sum.o
3> 把main.o、sum.o鏈接在一起,生成可執行文件
4> 運行程序
說到這里,有人可能有疑惑:可不可以在main.c中包含sum.c文件,不要sum.h文件了?
大家都知道#include的功能是拷貝內容,因此上面的代碼等效於:
這么一看,語法上是絕對沒有問題的,main.c、sum.c都能編譯成功,分別生成sum.o、main.o文件。但是當我們同時鏈接main.o和sum.o時會出錯。原因:當鏈接這兩個文件時鏈接器會發現sum.o和main.o里面都有sum函數的定義,於是報"標識符重復"的錯誤,也就是說sum函數被重復定義了。默認情況下,C語言不允許兩個函數的名字相同。因此,不要嘗試去#include那些.c源文件。
有人可能覺得分出sum.h和sum.c文件的這種做法好傻B,好端端多出2個文件,你把所有的東西都寫到main.c不就可以了么?
- 沒錯,整個C程序的代碼是可以都寫在main.c中。但是,如果項目做得很大,你可以想象得到,main.c這個文件會有多么龐大,會嚴重降低開發和調試效率。
- 要想出色地完成一個大項目,需要一個團隊的合作,不是一個人就可以搞的定的。如果把所有的代碼都寫在main.c中,那就導致代碼沖突,因為整個團隊的開發人員都在修改main.c文件,張三修改的代碼很有可能會抹掉李四之前添加的代碼。
- 正常的模式應該是這樣:假設張三負責編寫 main函數,李四負責編寫其他自定義函數,張三需要用到李四編寫的某個函數,怎么辦呢?李四可以將所有自定義函數的聲明寫在一個.h文件中,比如 lisi.h,然后張三在他自己的代碼中用#include包含lisi.h文件,接着就可以調用lisi.h中聲明的函數了,而李四呢,可以獨立地在另外一個文件中(比如lisi.c)編寫函數的定義,實現那些在lisi.h中聲明的函數。這樣子,張三和李四就可以相互協作、不會沖突。