判斷棧和堆的生長方向


如何判斷棧的增長方向?

對於一個用慣了i386系列機器的人來說,這似乎是一個無聊的問題,因為棧就是從高地址向低地址增長。不過,顯然這不是這個問題的目的,既然把這個問題拿出來,問的就不只是i386系列的機器,跨硬件平台是這個問題的首先要考慮到的因素。

在一個物質極大豐富的年代,除非無路可退,否則我們堅決不會使用匯編去解決問題,而對於這種有系統編程味道的問題,C是一個不錯的選擇。那接下來的問題就是如何用C去解決這個問題。

C在哪里會用到棧呢?稍微了解一點C的人都會立刻給出答案,沒錯,函數。我們知道,局部變量都存在於棧之中。似乎這個問題立刻就得到了解答,用一個函數聲明兩個局部變量,然后比較兩個變量的地址,這樣就可以得到答案。

等一下,怎么比較兩個變量的地址呢?

先聲明的先入棧,所以,它的第一個變量的地址如果是高的,那就是從上向下增長。“先聲明的先入棧”?這個結論從何而來?一般編譯器都會這么處理。要是不一般呢?這種看似正確的方法實際上是依賴於編譯器的,所以,可移植性受到了挑戰。

那就函數加個參數,比較參數和局部變量的位置,參數肯定先入棧。那為什么不能局部變量先入棧?第一反應是怎么可能,但仔細想來又沒有什么不可以。所以,這種方法也依賴於編譯器的實現。

那到底什么才不依賴於編譯器呢?

不妨回想一下,函數如何調用。執行一個函數時,這個函數的相關信息都會出現棧之中,比如參數、返回地址和局部變量。當它調用另一個函數時,在它棧信息保持不變的情況下,會把它調用那個函數的信息放到棧中。

似乎發現了什么,沒錯,兩個函數的相關信息位置是固定的,肯定是先調用的函數其信息先入棧,后調用的函數其信息后入棧。那接下來,問題的答案就浮出了水面。

比如,設計兩個函數,一個作為調用方,另一個作為被調用方。被調用方以一個地址(也就是指針)作為自己的入口參數,調用方傳入的地址是自己的一個局部變量的地址,然后,被調用方比較這個地址和自己的一個局部變量地址,由此確定棧的增長方向。

給出了一個解決方案之后,我們再回過頭來看看為什么之前的做法問題出在哪。為什么一個函數解決不了這個問題。前面這個大概解釋了函數調用的過程,我們提到,函數的相關信息會一起送入棧,這些信息就包括了參數、返回地址和局部變量等等,在計算機的術語里,有個說法叫棧幀,指的就是這些與一次函數調用相關的東西,而在一個棧幀內的這些東西其相對順序是由編譯器決定的,所以,僅僅在一個棧幀內做比較,都會有對編譯器的依賴。就這個問題而言,參數和局部變量,甚至包括返回地址,都是相同的,因為它們在同一個棧幀內,它們之間的比較是不能解決這個問題的,而它們就是一個函數的所有相關信息,所以,一個函數很難解決這個問題。

好了,既然有了這個了解,顯然可以擴展一下前面的解決方案,可以兩個棧幀內任意的東西進行比較,比如,各自的入口參數,都可以確定棧的增長方向。

狂想一下,會不會有編譯器每次專門留下些什么,等下一個函數的棧幀入棧之后,在把這個留下的東西入棧呢?這倒是個破壞的好方法。如果哪位知道有這么神奇的編譯器,不妨告訴我。我們可以把它的作者拉過來打一頓,想折磨死誰啊!

 

#include<stdio.h>

void func1();
void func2(int *a);

void func1()
{
    int a=0;
    func2(&a);
}
void func2(int *a)
{
    int b=0;
    printf("%x\n%x\n",a,&b);
}


int main()
{
    func1();
}

結果:

29f6ac
29f5c8
請按任意鍵繼續. . .

可以看到,a>b;說明生長方向向上。電腦中棧的增長方向是由高地址向低地址方向增長的。

 

為什么棧向下增長?

“這個問題與虛擬地址空間的分配規則有關,每一個可執行C程序,從低地址到高地址依次是:text,data,bss,堆,棧,環境參數變量;其中堆和棧之間有很大的地址空間空閑着,在需要分配空間的時候,堆向上漲,棧往下漲。”

這樣設計可以使得堆和棧能夠充分利用空閑的地址空間。如果棧向上漲的話,我們就必須得指定棧和堆的一個嚴格分界線,但這個分界線怎么確定呢?平均分?但是有的程序使用的堆空間比較多,而有的程序使用的棧空間比較多。所以就可能出現這種情況:一個程序因為棧溢出而崩潰的時候,其實它還有大量閑置的堆空間呢,但是我們卻無法使用這些閑置的堆空間。所以呢,最好的辦法就是讓堆和棧一個向上漲,一個向下漲,這樣它們就可以最大程度地共用這塊剩余的地址空間,達到利用率的最大化!

呵呵,其實當你明白這個原理的時候,你也會不由地驚嘆當時設計計算機的那些科學家驚人的聰明和智慧!!

(堆棧方向相反極小情況會發生的問題,堆棧重疊)。

 

為什么要把堆和棧分開?

 為什么要把堆和棧區分出來呢?棧中不是也可以存儲數據嗎?

      第一,從軟件設計的角度看,棧代表了處理邏輯,而堆代表了數據。

      這樣分開,使得處理邏輯更為清晰。分而治之的思想。這種隔離、模塊化的思想在軟件設計的方方面面都有體現。

  第二,堆與棧的分離,使得堆中的內容可以被多個棧共享(也可以理解為多個線程訪問同一個對象)。這種共享的收益是很多的。一方面這種共享提供了一種有效的數據交互方式(如:共享內存),另一方面,堆中的共享常量和緩存可以被所有棧訪問,節省了空間。

  第三,棧因為運行時的需要,比如保存系統運行的上下文,需要進行地址段的划分。由於棧只能向上增長,因此就會限制住棧存儲內容的能力。而堆不同,堆中的對象是可以根據需要動態增長的,因此棧和堆的拆分,使得動態增長成為可能,相應棧中只需記錄堆中的一個地址即可。

  第四,面向對象就是堆和棧的完美結合。其實,面向對象方式的程序與以前結構化的程序在執行上沒有任何區別。但是,面向對象的引入,使得對待問題的思考方式發生了改變,而更接近於自然方式的思考。當我們把對象拆開,你會發現,對象的屬性其實就是數據,存放在堆中;而對象的行為(方法),就是運行邏輯,放在棧中。我們在編寫對象的時候,其實即編寫了數據結構,也編寫的處理數據的邏輯。不得不承認,面向對象的設計,確實很美。

 

遞歸溢出原因:

1.遞歸層次太深。

2.人為

   #include  
  int main ( ) 
  { 
  char name[8]; 
  printf("Please type your name: "); 
  gets(name); 
  printf("Hello, %s!", name); 
  return 0; 
  }

 

堆棧溢出

  現在我們再執行一次,輸入ipxodiAAAAAAAAAAAAAAA,執行完gets(name)之后,由於我們輸入的name字符串太長,name數組容納不下,只好向內存頂部繼續寫‘A’。由於堆棧的生長方向與內存的生長方向相反,這些‘A’覆蓋了堆棧的老的元素。 我們可以發現,EBP,ret都已經被‘A’覆蓋了。在main返回的時候,就會把‘AAAA’的ASCII碼:0x41414141作為返回地址,CPU會試圖執行0x41414141處的指令,結果出現錯誤。這就是一次堆棧溢出

  3、如何利用堆棧溢出

  我們已經制造了一次堆棧溢出。其原理可以概括為:由於字符串處理函數(gets,strcpy等等)沒有對數組越界加以監視和限制,我們利用字符數組寫越界,覆蓋堆棧中的老元素的值,就可以修改返回地址。(更多:http://security.ctocio.com.cn/tips/485/7723985.shtml)。

 

 

堆(heap)和棧(stack)有什么區別??

 

簡單的可以理解為:

heap:是由malloc之類函數分配的空間所在地。地址是由低向高增長的。

stack:是自動分配變量,以及函數調用的時候所使用的一些空間。地址是由高向低減少的。

 

預備知識—程序的內存分配

 

一個由c/C++編譯的程序占用的內存分為以下幾個部分

1、棧區(stack)— 由編譯器自動分配釋放 ,存放函數的參數值,局部變量的值等。其操作方式類似於數據結構中的棧。

2、堆區(heap) — 一般由程序員分配釋放, 若程序員不釋放,程序結束時可能由OS回收 。注意它與數據結構中的堆是兩回事,分配方式倒是類似於鏈表,呵呵。

3、全局區(靜態區)(static)—,全局變量和靜態變量的存儲是放在一塊的,初始化的全局變量和靜態變量在一塊區域, 未初始化的全局變量和未初始化的靜態變量在相鄰的另一塊區域。 - 程序結束后有系統釋放

4、文字常量區 —常量字符串就是放在這里的。 程序結束后由系統釋放

5、程序代碼區—存放函數體的二進制代碼。

 

二、例子程序

這是一個前輩寫的,非常詳細

//main.cpp

int a = 0; 全局初始化區

char *p1; 全局未初始化區

main()

{

int b; 棧

char s[] = "abc"; 棧

char *p2; 棧

char *p3 = "123456"; 123456在常量區,p3在棧上。

static int c =0; 全局(靜態)初始化區

p1 = (char *)malloc(10);

p2 = (char *)malloc(20);

分配得來得10和20字節的區域就在堆區。

strcpy(p1, "123456"); 123456放在常量區,編譯器可能會將它與p3所指向的"123456"優化成一個地方。

}

 

 

二、堆和棧的理論知識

2.1申請方式

stack:

由系統自動分配。 例如,聲明在函數中一個局部變量 int b; 系統自動在棧中為b開辟空間

heap:

需要程序員自己申請,並指明大小,在c中malloc函數

如p1 = (char *)malloc(10);

在C++中用new運算符

如p2 = (char *)malloc(10);

但是注意p1、p2本身是在棧中的。

2.2

申請后系統的響應

棧:只要棧的剩余空間大於所申請空間,系統將為程序提供內存,否則將報異常提示棧溢出。

堆:首先應該知道操作系統有一個記錄空閑內存地址的鏈表,當系統收到程序的申請時,

會遍歷該鏈表,尋找第一個空間大於所申請空間的堆結點,然后將該結點從空閑結點鏈表中刪除,並將該結點的空間分配給程序,另外,對於大多數系統,會在這塊內存空間中的首地址處記錄本次分配的大小,這樣,代碼中的delete語句才能正確的釋放本內存空間。另外,由於找到的堆結點的大小不一定正好等於申請的大小,系統會自動的將多余的那部分重新放入空閑鏈表中。

2.3申請大小的限制

棧:在Windows下,棧是向低地址擴展的數據結構,是一塊連續的內存的區域。這句話的意思是棧頂的地址和棧的最大容量是系統預先規定好的,在 WINDOWS下,棧的大小是2M(也有的說是1M,總之是一個編譯時就確定的常數),如果申請的空間超過棧的剩余空間時,將提示overflow。因此,能從棧獲得的空間較小。

堆:堆是向高地址擴展的數據結構,是不連續的內存區域。這是由於系統是用鏈表來存儲的空閑內存地址的,自然是不連續的,而鏈表的遍歷方向是由低地址向高地址。堆的大小受限於計算機系統中有效的虛擬內存。由此可見,堆獲得的空間比較靈活,也比較大。

2.4申請效率的比較:

棧由系統自動分配,速度較快。但程序員是無法控制的。

堆是由new分配的內存,一般速度比較慢,而且容易產生內存碎片,不過用起來最方便.

另外,在WINDOWS下,最好的方式是用VirtualAlloc分配內存,他不是在堆,也不是在棧是直接在進程的地址空間中保留一快內存,雖然用起來最不方便。但是速度, 也最靈活

2.5堆和棧中的存儲內容

棧: 在函數調用時,第一個進棧的是主函數中后的下一條指令(函數調用語句的下一條可執行語句)的地址,然后是函數的各個參數,在大多數的C編譯器中,參數是由右往左入棧的,然后是函數中的局部變量。注意靜態變量是不入棧的。

當本次函數調用結束后,局部變量先出棧,然后是參數,最后棧頂指針指向最開始存的地址,也就是主函數中的下一條指令,程序由該點繼續運行。

堆:一般是在堆的頭部用一個字節存放堆的大小。堆中的具體內容有程序員安排。

2.6存取效率的比較

 

char s1[] = "aaaaaaaaaaaaaaa";

char *s2 = "bbbbbbbbbbbbbbbbb";

aaaaaaaaaaa是在運行時刻賦值的;

而bbbbbbbbbbb是在編譯時就確定的;

但是,在以后的存取中,在棧上的數組比指針所指向的字符串(例如堆)快。

比如:

#include

void main()

{

char a = 1;

char c[] = "1234567890";

char *p ="1234567890";

a = c[1];

a = p[1];

return;

}

對應的匯編代碼

10: a = c[1];

00401067 8A 4D F1 mov cl,byte ptr [ebp-0Fh]

0040106A 88 4D FC mov byte ptr [ebp-4],cl

11: a = p[1];

0040106D 8B 55 EC mov edx,dword ptr [ebp-14h]

00401070 8A 42 01 mov al,byte ptr [edx+1]

00401073 88 45 FC mov byte ptr [ebp-4],al

第一種在讀取時直接就把字符串中的元素讀到寄存器cl中,而第二種則要先把指edx中,在根據edx讀取字符,顯然慢了。

?

 

2.7小結:

堆和棧的區別可以用如下的比喻來看出:

使用棧就象我們去飯館里吃飯,只管點菜(發出申請)、付錢、和吃(使用),吃飽了就走,不必理會切菜、洗菜等准備工作和洗碗、刷鍋等掃尾工作,他的好處是快捷,但是自由度小。

使用堆就象是自己動手做喜歡吃的菜餚,比較麻煩,但是比較符合自己的口味,而且自由度大。

 

堆和棧的區別主要分:

操作系統方面的堆和棧,如上面說的那些,不多說了。

還有就是數據結構方面的堆和棧,這些都是不同的概念。這里的堆實際上指的就是(滿足堆性質的)優先隊列的一種數據結構,第1個元素有最高的優先權;棧實際上就是滿足先進后出的性質的數學或數據結構。

雖然堆棧,堆棧的說法是連起來叫,但是他們還是有很大區別的,連着叫只是由於歷史的原因針值讀

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM