預備知識—程序的內存分配
一個由C/C++編譯的程序占用的內存分為以下幾個部分
- 棧區(stack)— 由編譯器自動分配釋放,存放函數的參數值,局部變量的值等。其操作方式類似於數據結構中的棧。
- 堆區(heap) — 一般由程序員分配釋放,若程序員不釋放,程序結束時可能由OS回收 。注意它與數據結構中的堆是兩回事,分配方式倒是類似於鏈表。
- 全局區/靜態區(global/static)—,全局變量和靜態變量的存儲是放在一塊的,初始化的全局變量和靜態變量在一塊區域, 未初始化的全局變量、未初始化的靜態變量在相鄰的另一塊區域。 - 程序結束后有系統釋放 【靜態存儲區】
- 文字常量區 —常量字符串就是放在這里的。程序結束后由系統釋放
- 程序代碼區—存放函數體的二進制代碼。
一個正常的程序在內存中通常分為程序段、數據端、堆棧三部分。程序段里放着程序的機器碼、只讀數據,這個段通常是只讀,對它的寫操作是非法的。數據段放的是程序中的靜態數據。動態數據則通過堆棧來存放。
在內存中,它們的位置如下:
+------------------+ 內存低端
| 程序段 |
|------------------|
| 數據段 |
|------------------|
| 堆棧 |
+------------------+ 內存高端
堆棧是內存中的一個連續的塊。一個叫堆棧指針的寄存器(SP)指向堆棧的棧頂。堆棧的底部是一個固定地址。堆棧有一個特點就是,后進先出。也就是說,后放入的數據第一個取出。它支持兩個操作,PUSH和POP。PUSH是將數據放到棧的頂端,POP是將棧頂的數據取出。
在高級語言中,程序函數調用、函數中的臨時變量都用到堆棧。為什么呢?因為在調用一個函數時,我們需要對當前的操作進行保護,也為了函數執行后,程序可以正確的找到地方繼續執行,所以參數的傳遞和返回值也用到了堆棧。通常對局部變量的引用是通過給出它們對SP的偏移量來實現的。另外還有一個基址指針(FP,在Intel芯片中是BP),許多編譯器實際上是用它來引用本地變量和參數的。通常,參數的相對FP的偏移是正的,局部變量是負的。
當程序中發生函數調用時,計算機做如下操作:首先把參數壓入堆棧;然后保存指令寄存器(IP)中的內容,做為返回地址(RET);第三個放入堆棧的是基址寄存器(FP);然后把當前的棧指針(SP)拷貝到FP,做為新的基地址;最后為本地變量留出一定空間,把SP減去適當的數值。
在函數體中定義的變量通常是在棧上,用malloc, calloc, realloc等分配內存的函數分配得到的就是在堆上。在所有函數體外定義的是全局量,加了static修飾符后不管在哪里都存放在全局區(靜態區),在所有函數體外定義的static變量表示在該文件中有效,不能extern到別的文件用;在函數體內定義的static表示只在該函數體內有效。另外,函數中的"adgfdf"這樣的字符串存放在常量區。
對比:
1 性能
棧:棧存在於RAM中。棧是動態的,它的存儲速度是第二快的。stack
堆:堆位於RAM中,是一個通用的內存池。所有的對象都存儲在堆中。heap
2 申請方式
stack【棧】: 由系統自動分配。 例如,聲明在函數中一個局部變量 int b; 系統自動在棧中為b開辟空間 。
heap【堆】: 需要程序員自己申請,並指明大小,在c中malloc函數 如p1 = (char *)malloc(10); 在C++中用new運算符 如p2 = (char *)malloc(10); 但是注意:p1、p2本身是在棧中的。
3 申請后系統的響應
棧【stack】:只要棧的剩余空間大於所申請空間,系統將為程序提供內存,否則將報異常提示棧溢出。
堆【heap】:首先應該知道操作系統有一個記錄空閑內存地址的鏈表,當系統收到程序的申請時,會遍歷該鏈表,尋找第一個空間大於所申請空間的堆結點,然后將該結點從空閑結點鏈表中刪除,並將該結點的空間分配給程序;另外,對於大多數系統,會在這塊內存空間中的首地址處記錄本次分配的大小,這樣,代碼中的delete語句才能正確的釋放本內存空間。另外,由於找到的堆結點的大小不一定正好等於申請的大小,系統會自動的將多余的那部分重新放入空閑鏈表中。
4 申請大小的限制
棧【stack】:在Windows下,棧是向低地址擴展的數據結構,是一塊連續的內存的區域。這句話的意思是棧頂的地址和棧的最大容量是系統預先規定好的,在WINDOWS下,棧的大小是2M(也有的說是1M,總之是一個編譯時就確定的常數),如果申請的空間超過棧的剩余空間時,將提示overflow。因此,能從棧獲得的空間較小。
堆【heap】:堆是向高地址擴展的數據結構,是不連續的內存區域。這是由於系統是用鏈表來存儲的空閑內存地址的,自然是不連續的,而鏈表的遍歷方向是由低地址向高地址。堆的大小受限於計算機系統中有效的虛擬內存。由此可見,堆獲得的空間比較靈活,也比較大。
5 申請效率的比較
棧【stack】:由系統自動分配,速度較快。但程序員是無法控制的。
堆【heap】:是由new分配的內存,一般速度比較慢,而且容易產生內存碎片,不過用起來最方便.
另外,在WINDOWS下,最好的方式是用VirtualAlloc分配內存,他不是在堆,也不是在棧是直接在進程的地址空間中保留一快內存,雖然用起來最不方便。但是速度快,也最靈活。
6 堆和棧中的存儲內容
棧【stack】:在函數調用時,第一個進棧的是主函數中后的下一條指令(函數調用語句的下一條可執行語句)的地址,然后是函數的各個參數,在大多數的C編譯器中,參數是由右往左入棧的,然后是函數中的局部變量。注意靜態變量是不入棧的。
當本次函數調用結束后,局部變量先出棧,然后是參數,最后棧頂指針指向最開始存的地址,也就是主函數中的下一條指令,程序由該點繼續運行。
堆【heap】:一般是在堆的頭部用一個字節存放堆的大小。堆中的具體內容有程序員安排。
7 存取效率的比較
char s1[] = "aaaaaaaaaaaaaaa";
char *s2 = "bbbbbbbbbbbbbbbbb";
aaaaaaaaaaa是在運行時刻賦值的; 而bbbbbbbbbbb是在編譯時就確定的; 但是,在以后的存取中,在棧上的數組比指針所指向的字符串(例如堆)快。
比如:
#include
void main()
{
char a = 1;
char c[] = "1234567890";
char *p ="1234567890";
a = c[1];
a = p[1];
return;
}
對應的匯編代碼
10: a = c[1];
00401067 8A 4D F1 mov cl,byte ptr [ebp-0Fh]
0040106A 88 4D FC mov byte ptr [ebp-4],cl
11: a = p[1];
0040106D 8B 55 EC mov edx,dword ptr [ebp-14h]
00401070 8A 42 01 mov al,byte ptr [edx+1]
00401073 88 45 FC mov byte ptr [ebp-4],al
第一種在讀取時直接就把字符串中的元素讀到寄存器cl中,而第二種則要先把指針值讀到edx中,在根據edx讀取字符,顯然慢了。
小結:
堆和棧的區別可以用如下的比喻來看出:
使用棧就象我們去飯館里吃飯,只管點菜(發出申請)、付錢、和吃(使用),吃飽了就走,不必理會切菜、洗菜等准備工作和洗碗、刷鍋等掃尾工作,他的好處是快捷,但是自由度小。
使用堆就象是自己動手做喜歡吃的菜餚,比較麻煩,但是比較符合自己的口味,而且自由度大。
-------------------------------------------------------------
一般全局變量存放在數據區,局部變量存放在棧區,
動態變量存放在堆區,函數代碼放在代碼區。
---------------------------------------------------------------
棧區是普通的棧數據結構,遵循LIFO后進先出的規則,局部變量安排在那里是ASM時就規定的,這樣可以在一個函數結束后平衡堆棧,操作簡單,效率高
堆(動態區)在這里應當叫堆棧(不要和數據結構中的堆搞混)是程序在編譯時產生的一塊用於產生動態內存分配使用的塊,操作比較棧要麻煩許多,在分配時要判 斷最優的地址(防止產生無用的內存碎片(由於屢次的NEW和DELETE產生的夾在兩塊使用中內存中的空余小內存(不容易被分配))),分配和回收時的效 率比棧低多了
---------------------------------------------------------------
棧是系統提供的功能,特點是快速高效,缺點是有限制,數據不靈活;而堆是函數庫提供的功能,特點是靈活方便,數據適應面廣泛,但是效率有一定降低。棧是系 統數據結構,對於進程/線程是唯一的;堆是函數庫內部數據結構,不一定唯一。不同堆分配的內存無法互相操作。棧空間分靜態分配和動態分配兩種。靜態分配是 編譯器完成的,比如自動變量(auto)的分配。動態分配由malloc函數完成。棧的動態分配無需釋放(是自動的),也就沒有釋放函數。為可移植的程序 起見,棧的動態分配操作是不被鼓勵的!堆空間的分配總是動態的,雖然程序結束時所有的數據空間都會被釋放回系統,但是精確的申請內存/ 釋放內存匹配是良好程序的基本要素。
---------------------------------------------------------------
堆是程序員管理的,棧是系統管理的.
---------------------------------------------------------------
---------------------------------------------------------------
另外關於靜態和全局的一些問題:
靜態變量的特點:
1、 一次存儲:靜態局部變量只被初始化一次,下一次初始化根據上一次的結果值,有點類似於c++中類的靜態成員變量,即無論該類型生成多少個實例對象,所有的對象共用一個靜態變量,到這里就是無論這個函數調用多少次,該靜態變量只初始化一次,並沒有因為超出其生存期而被銷毀,只是外部不可見而已,用個例子說明之:
void fun1( int v )
{
static int value = v;
static int value = v;
}
int main( int arc, char *args[ ])
{
fun1( 50 );
fun1( 100 );
}
執行的結果是:value : 50 value : 50
說明在第二次調用fun1( )時的初始化value的采用的是上一次value的值,value在靜態區的存儲空間並沒有因為fun1( )的結束而被釋放,即體現了一次存儲;
2、 作用域限定:靜態修飾的作用域限定功能同時體現在函數與變量上;
a)對於函數而言,任何用static修飾的函數,其作用域僅為當前源文件,而對外部來說這個函數是不可見的,即只有和其在同一源文件中的函數才能調用這個靜態函數;反過來說,如果一個函數僅僅被同一源文件中的其他函數調用,那么這個函數應該聲明為靜態的,這樣做的好處在於:可以一定程度上的解決不同源文件之間函數的命名沖突問題;
b)對於變量而言,static修飾的全局變量,只在當前源文件中有效,對外部不可見,外部文件不能夠引用;
顧名思義,全局變量是指能夠在全局引用的變量,相對於局部變量的概念,也叫外部變量;同靜態變量一樣,全局變量位於靜態數據區,全局變量一處定義,多處引用,用關鍵字“extern”引用“外部”的變量。
全局變量也可以是靜態的,在前面有過說明,靜態全局變量的意義就是不讓“外部”引用,是單個源文件里的全局變量,即是編譯階段的全局變量,而不是連接階段的全局變量。
---------------------------------------------------------------
通過上面的分析,我們不難得出以下結論:
1.靜態函數與普通函數的區別在於:靜態函數不可以被同一源文件以外的函數調用。
2.靜態局部變量與普通局部變量的區別在於:靜態局部變量只初始化一次,下一次初始化實際上是依然是上一次的值;
3.靜態全局變量與普通全局變量的區別在於:靜態全局變量的作用域僅限於所在的源文件。