在任何程序設計環境及語言中,內存管理都十分重要。在目前的計算機系統或嵌入式系統中,內存資源仍然是有限的。因此在程序設計中,有效地管理內存資源是程序員首先考慮的問題。
第1節主要介紹內存管理基本概念,重點介紹C程序中內存的分配,以及C語言編譯后的可執行程序的存儲結構和運行結構,同時還介紹了堆空間和棧空間的用途及區別。
第2節主要介紹C語言中內存分配及釋放函數、函數的功能,以及如何調用這些函數申請/釋放內存空間及其注意事項。
3.1 內存管理基本概念
3.1.1 C程序內存分配
1.C程序結構
下面列出C語言可執行程序的基本情況(Linux 2.6環境/GCC4.0)。
[root@localhost Ctest]# ls test -l //test為一個可執行程序 |
可以看出,此可執行程序在存儲時(沒有調入到內存)分為代碼區(text)、數據區(data)和未初始化數據區(bss)3個部分。
(1)代碼區(text segment)。存放CPU執行的機器指令(machine instructions)。通常,代碼區是可共享的(即另外的執行程序可以調用它),因為對於頻繁被執行的程序,只需要在內存中有一份代碼即可。代碼區通常是只讀的,使其只讀的原因是防止程序意外地修改了它的指令。另外,代碼區還規划了局部變量的相關信息。
(2)全局初始化數據區/靜態數據區(initialized data segment/data segment)。該區包含了在程序中明確被初始化的全局變量、靜態變量(包括全局靜態變量和局部靜態變量)和常量數據(如字符串常量)。例如,一個不在任何函數內的聲明(全局數據):
int maxcount = 99; |
使得變量maxcount根據其初始值被存儲到初始化數據區中。
static mincount=100; |
這聲明了一個靜態數據,如果是在任何函數體外聲明,則表示其為一個全局靜態變量,如果在函數體內(局部),則表示其為一個局部靜態變量。另外,如果在函數名前加上static,則表示此函數只能在當前文件中被調用。
(3)未初始化數據區。亦稱BSS區(uninitialized data segment),存入的是全局未初始化變量。BSS這個叫法是根據一個早期的匯編運算符而來,這個匯編運算符標志着一個塊的開始。BSS區的數據在程序開始執行之前被內核初始化為0或者空指針(NULL)。例如一個不在任何函數內的聲明:
long sum[1000]; |
將變量sum存儲到未初始化數據區。
圖3-1所示為可執行代碼存儲時結構和運行時結構的對照圖。一個正在運行着的C編譯程序占用的內存分為代碼區、初始化數據區、未初始化數據區、堆區和棧區5個部分。
![]() |
(點擊查看大圖)圖3-1 C程序的內存布局 |
(1)代碼區(text segment)。代碼區指令根據程序設計流程依次執行,對於順序指令,則只會執行一次(每個進程),如果反復,則需要使用跳轉指令,如果進行遞歸,則需要借助棧來實現。
代碼區的指令中包括操作碼和要操作的對象(或對象地址引用)。如果是立即數(即具體的數值,如5),將直接包含在代碼中;如果是局部數據,將在棧區分配空間,然后引用該數據地址;如果是BSS區和數據區,在代碼中同樣將引用該數據地址。
(2)全局初始化數據區/靜態數據區(Data Segment)。只初始化一次。
(3)未初始化數據區(BSS)。在運行時改變其值。
(4)棧區(stack)。由編譯器自動分配釋放,存放函數的參數值、局部變量的值等。其操作方式類似於數據結構中的棧。每當一個函數被調用,該函數返回地址和一些關於調用的信息,比如某些寄存器的內容,被存儲到棧區。然后這個被調用的函數再為它的自動變量和臨時變量在棧區上分配空間,這就是C實現函數遞歸調用的方法。每執行一次遞歸函數調用,一個新的棧框架就會被使用,這樣這個新實例棧里的變量就不會和該函數的另一個實例棧里面的變量混淆。
(5)堆區(heap)。用於動態內存分配。堆在內存中位於bss區和棧區之間。一般由程序員分配和釋放,若程序員不釋放,程序結束時有可能由OS回收。
之所以分成這么多個區域,主要基於以下考慮:
一個進程在運行過程中,代碼是根據流程依次執行的,只需要訪問一次,當然跳轉和遞歸有可能使代碼執行多次,而數據一般都需要訪問多次,因此單獨開辟空間以方便訪問和節約空間。
臨時數據及需要再次使用的代碼在運行時放入棧區中,生命周期短。
全局數據和靜態數據有可能在整個程序執行過程中都需要訪問,因此單獨存儲管理。
堆區由用戶自由分配,以便管理。
下面通過一段簡單的代碼來查看C程序執行時的內存分配情況。相關數據在運行時的位置如注釋所述。
//main.cpp |
2.內存分配方式
在C語言中,對象可以使用靜態或動態的方式分配內存空間。
靜態分配:編譯器在處理程序源代碼時分配。
動態分配:程序在執行時調用malloc庫函數申請分配。
靜態內存分配是在程序執行之前進行的因而效率比較高,而動態內存分配則可以靈活的處理未知數目的。
靜態與動態內存分配的主要區別如下:
靜態對象是有名字的變量,可以直接對其進行操作;動態對象是沒有名字的變量,需要通過指針間接地對它進行操作。
靜態對象的分配與釋放由編譯器自動處理;動態對象的分配與釋放必須由程序員顯式地管理,它通過malloc()和free兩個函數(C++中為new和delete運算符)來完成。
以下是采用靜態分配方式的例子。
int a=100; |
此行代碼指示編譯器分配足夠的存儲區以存放一個整型值,該存儲區與名字a相關聯,並用數值100初始化該存儲區。
以下是采用動態分配方式的例子。
p1 = (char *)malloc(10*sizeof(int));//分配得來得10*4字節的區域在堆區 |
此行代碼分配了10個int類型的對象,然后返回對象在內存中的地址,接着這個地址被用來初始化指針對象p1,對於動態分配的內存唯一的訪問方式是通過指針間接地訪問,其釋放方法為:
free(p1); |
3.1.2 棧和堆的區別
前面已經介紹過,棧是由編譯器在需要時分配的,不需要時自動清除的變量存儲區。里面的變量通常是局部變量、函數參數等。堆是由malloc()函數(C++語言為new運算符)分配的內存塊,內存釋放由程序員手動控制,在C語言為free函數完成(C++中為delete)。棧和堆的主要區別有以下幾點:
(1)管理方式不同。
棧編譯器自動管理,無需程序員手工控制;而堆空間的申請釋放工作由程序員控制,容易產生內存泄漏。
(2)空間大小不同。
棧是向低地址擴展的數據結構,是一塊連續的內存區域。這句話的意思是棧頂的地址和棧的最大容量是系統預先規定好的,當申請的空間超過棧的剩余空間時,將提示溢出。因此,用戶能從棧獲得的空間較小。
堆是向高地址擴展的數據結構,是不連續的內存區域。因為系統是用鏈表來存儲空閑內存地址的,且鏈表的遍歷方向是由低地址向高地址。由此可見,堆獲得的空間較靈活,也較大。棧中元素都是一一對應的,不會存在一個內存塊從棧中間彈出的情況。
(3)是否產生碎片。
對於堆來講,頻繁的malloc/free(new/delete)勢必會造成內存空間的不連續,從而造成大量的碎片,使程序效率降低(雖然程序在退出后操作系統會對內存進行回收管理)。對於棧來講,則不會存在這個問題。
(4)增長方向不同。
堆的增長方向是向上的,即向着內存地址增加的方向;棧的增長方向是向下的,即向着內存地址減小的方向。
(5)分配方式不同。
堆都是程序中由malloc()函數動態申請分配並由free()函數釋放的;棧的分配和釋放是由編譯器完成的,棧的動態分配由alloca()函數完成,但是棧的動態分配和堆是不同的,他的動態分配是由編譯器進行申請和釋放的,無需手工實現。
(6)分配效率不同。
棧是機器系統提供的數據結構,計算機會在底層對棧提供支持:分配專門的寄存器存放棧的地址,壓棧出棧都有專門的指令執行。堆則是C函數庫提供的,它的機制很復雜,例如為了分配一塊內存,庫函數會按照一定的算法(具體的算法可以參考數據結構/操作系統)在堆內存中搜索可用的足夠大的空間,如果沒有足夠大的空間(可能是由於內存碎片太多),就有需要操作系統來重新整理內存空間,這樣就有機會分到足夠大小的內存,然后返回。顯然,堆的效率比棧要低得多。
3.1.3 Linux數據類型大小
在Linux操作系統下使用GCC進行編程,目前一般的處理器為32位字寬,下面是/usr/include/limit.h文件對Linux下數據類型的限制及存儲字節大小的說明。
/* We don't have #include_next. Define ANSI for standard 32-bit words. */ |
1.char數據類型
char類型數據所占內存空間為8位。其中有符號字符型變量取值范圍為?128~127,無符號型字符變量取值范圍為0~255。其限制如下:
/* Number of bits in a 'char'. */ |
2.short int數據類型
short int類型數據所占內存空間為16位。其中有符號短整型變量取值范圍為?32768~32767,無符號短整型變量取值范圍為0~65535。其限制如下:
/* Minimum and maximum values a 'signed short int' can hold. */ // 有符號短整型范圍 |
3.int數據類型
int類型數據所占內存空間為32位。其中有符號整型變量取值范圍為?2147483648~2147483647,無符號型整型變量取值范圍為0~4294967295U。其限制如下:
/* Minimum and maximum values a 'signed int' can hold. */ //整形范圍 |
4.long int數據類型
隨着宏__WORDSIZE值的改變,long int數據類型的大小也會發生改變。如果__WORDSIZE的值為32,則long int和int類型一樣,占有32位。在Linux GCC4.0-i386版本中,默認情況下__WORDSIZE的值為32。其定義如下:
//come from /usr/include/bits/wordsize.h |
在64位機器上,如果__WORDSIZE的值為64, long int類型數據所占內存空間為64位。其中有長整型變量取值范圍為-9223372036854775808L~3372036854775807L,無符號長整型變量取值范圍為0~18446744073709551615UL。其限制如下:
/* Minimum and maximum values a 'signed long int' can hold. */ //有符號長整形范圍 |
5.long long int數據類型
在C99中,還定義了long long int數據類型。其數據類型限制如下:
# ifdef __USE_ISOC99 |
3.1.4 數據存儲區域實例
此程序顯示了數據存儲區域實例,在此程序中,使用了etext、edata和end3個外部全局變量,這是與用戶進程相關的虛擬地址。
在程序源代碼中列出了各數據的存儲位置,同時在程序運行時顯示了各數據的運行位置,圖3-2所示為程序運行過程中各變量的存儲位置。
![]() |
圖3-2 函數運行時各數據位置 |
主函數源代碼如下:
[root@localhost linux_app]# cat mem_add.c extern void afunc(void); int bss_var; //未初始化全局數據存儲在BSS區 int main(int argc,char *argv[]) |
子函數源代碼如下:
void afunc(void) |
函數運行結果如下:
[root@localhost linux_app]# gcc -o mem_add mem_add.c //編譯 text Location: bss Location: data location: Stack Locations: Heap Locations: b and nb in Stack |
如果運行環境不一樣,運行程序的地址與此將有差異,但是,各區域之間的相對關系不會發生變化。可以通過readelf命令來查看可執行文件的詳細內容。
[root@localhost yangzongde]# readelf -a memadd |
3.2 內存管理函數
3.2.1 malloc/free函數
Malloc()函數用來在堆中申請內存空間,free()函數釋放原先申請的內存空間。Malloc()函數是在內存的動態存儲區中分配一個長度為size字節的連續空間。其參數是一個無符號整型數,返回一個指向所分配的連續存儲域的起始地址的指針。當函數未能成功分配存儲空間時(如內存不足)則返回一個NULL指針。
由於內存區域總是有限的,不能無限制地分配下去,而且程序應盡量節省資源,所以當分配的內存區域不用時,則要釋放它,以便其他的變量或程序使用。
這兩個函數的庫頭文件為:
#include |
函數定義如下:
void *malloc(size_t size) //返回類型為空指針類型 |
例如:
int *p1,*p2; |
malloc()函數返回值賦給p1,又把p1的值賦給p2,所以此時p1,p2都可作為free函數的參數。使用free()函數時,需要特別注意下面幾點:
(1)調用free()釋放內存后,不能再去訪問被釋放的內存空間。內存被釋放后,很有可能該指針仍然指向該內存單元,但這塊內存已經不再屬於原來的應用程序,此時的指針為懸掛指針(可以賦值為NULL)。
(2)不能兩次釋放相同的指針。因為釋放內存空間后,該空間就交給了內存分配子程序,再次釋放內存空間會導致錯誤。也不能用free來釋放非malloc()、calloc()和realloc()函數創建的指針空間,在編程時,也不要將指針進行自加操作,使其指向動態分配的內存空間中間的某個位置,然后直接釋放,這樣也有可能引起錯誤。
(3)在進行C語言程序開發中,malloc/free是配套使用的,即不需要的內存空間都需要釋放回收。
下面是使用這兩個函數的一個例子。
[root@localhost yangzongde]# cat malloc_example.c |
在以上程序中,(1)句中包含stdio.h頭文件,從而在后面可以調用printf()函數。(2)句中包含stdlib.h頭文件,其是malloc()函數的頭文件。(3)句為函數的入口位置,此處采用Linux下編程標准,返回值為int型,argc為參數個數, argv[]為參數,envp[]存放的是所有環境變量。(4)句動態分配了10個整型存儲區域,此語句可以分為以下幾步。
① 分配10個整型的連續存儲空間,並返回一個指向其起始地址的整型指針。
② 把此整型指針地址賦給array。
③ 檢測返回值是否為NULL。
(5)、(6)句為數組賦值並打印輸出,以免內存泄漏。(7)句調用free()函數釋放內存空間。(8)句將一個NULL指針傳遞給array,雖然在很多情況下可以不用此句,但這樣處理可以避免此指針成為野指針。
在C++中,使用new和delete運算符來實現內存的分配和釋放,使用new/delete運算符實現內存管理比使用malloc/free函數更有優越性。new/delete運算符定義如下:
static void* operator new(size_t sz); //new運算符 |
下面是一段C++程序代碼:
void UseNewDelete(void) |
下面詳細介紹C++中new/delete運算符的使用方法。
class A |
其中,語句new A完成了以下兩個功能:
(1)調用運算符new,在自由存儲區分配一個sizeof(A)大小的內存空間。
(2)調用構造函數A(),在這塊內存空間上初始化對象。
當然,delete pA完成相反的兩件事:
(1)調用析構函數~A(),銷毀對象。
(2)調用運算符delete,釋放內存。
由此可以看出,運算符new和delete提供了動態分配和釋放存儲區的功能。它們的作用相當於C語言的malloc()和free()函數,但是性能更為優越。使用new比使用malloc()有以下幾個優點:
(1)new自動計算要分配給對象的內存空間大小,不使用sizeof運算符,簡單,而且可以避免錯誤。
(2)自動地返回正確的指針類型,不用進行強制類型轉換。
(3)用構造函數給分配的對象進行初始化。
但是,使用malloc函數和new分配內存的時候,本身並沒有對這塊內存空間做清零等任何動作。因此,申請內存空間后,其返回的新分配的內存是沒有零填充的,程序員需要使用memset()函數來初始化內存。
3.2.2 realloc--更改已經配置的內存空間
realloc()函數用來從堆上分配內存,當需要擴大一塊內存空間時,realloc()試圖直接從堆上當前內存段后面的字節中獲得更多的內存空間,如果能夠滿足,則返回原指針;如果當前內存段后面的空閑字節不夠,那么就使用堆上第一個能夠滿足這一要求的內存塊,將目前的數據復制到新的位置,而將原來的數據塊釋放掉。如果內存不足,重新申請空間失敗,則返回NULL。此函數定義如下:
void *realloc(void *ptr,size_t size) |
參數ptr為先前由malloc、calloc和realloc所返回的內存指針,而參數size為新配置的內存大小。其庫頭文件為:
#include<stdlib.h> |
當調用realloc()函數重新分配內存時,如果申請失敗,將返回NULL,此時原來指針仍然有效,因此在程序編寫時需要進行判斷,如果調用成功,realloc()函數會重新分配一塊新內存,並將原來的數據拷貝到新位置,返回新內存的指針,而釋放掉原來指針(realloc()函數的參數指針)指向的空間,原來的指針變為不可用(即不需要再釋放,也不能再釋放),因此,一般不使用以下語句:
ptr=realloc(ptr,new_amount) |
如果內存減少,malloc僅僅改變索引信息,但並不代表被減少的部分還可以訪問,這一部分內存將交給系統內存分配子程序。
下面是一個使用relloc函數的實例。
[root@localhost yangzongde]# cat realloc_example.c if((numbers2=(int *)malloc(5*sizeof(int)))==NULL) //(2)numbers2指針申請空間 printf("Enter an integer value you want to remalloc ( enter 0 to stop)\n");//(4)新申請空間大小 for(n=0;n<5;n++) //(6)這5個數是從numbers2拷貝而來 for(n=0;n<input;n++) //(7)新數據初始化 |
此程序是一個簡單的重新申請內存空間的實例,(1)為函數入口,前面已經介紹過。(2)從堆空間中申請5個int空間,將返回地址賦給numbers2,如果返回值為NULL,將返回錯誤信息,釋放numbers2並退出。(3)為新申請的空間初始化。(4)輸入需要增加的內存數量。(5)調用realloc()函數重新申請內存空間,重新申請內存空間大小為原有空間大小加上用戶輸入的內存空間數。如果申請失敗,將返回NULL,此時numbers2仍然有效。如果申請成功,將重新分配一塊大小合適的空間,並將新空間首地址賦給numbers1,同時將numbers2所指向的5個空間的數據復制到新的內存空間中,釋放掉原來numbers2所指向的內存空間。(6)打印從numbers2所指向的原空間拷貝的數據,(7)句對新增加的空間進行初始化。(8)句釋放number1所指向的新申請空間。(9)為注釋掉的代碼,提示讀者此時對原空間再次釋放,因為第(5)已經完成了這一操作。
3.2.3 其他內存管理函數calloc和alloca
1.calloc函數
calloc是malloc函數的簡單包裝,它的主要優點是把動態分配的內存進行初始化,全部清零。其操作及語法類似malloc()函數。
ptr=(struct data *)calloc (count,sizeof(strunt data)) //申請並初始化空間 |
下面是這個函數的實現描述:
void *calloc(size_t nmemb,size_t size) |
2.alloca函數
alloca()函數用來在棧中分配size個字節的內存空間,因此函數返回時會自動釋放掉空間。alloca函數定義及庫頭文件如下:
/* Allocate a block that will be freed when the calling function exits. */ |
返回值:若分配成功返回指針,失敗則返回NULL。
它與malloc()函數的區別主要在於:
alloca是向棧申請內存,無需釋放,malloc申請的內存位於堆中,最終需要函數free來釋放。
malloc函數並沒有初始化申請的內存空間,因此調用malloc()函數之后,還需調用函數memset初始化這部分內存空間;alloca則將初始化這部分內存空間為0。