實例分析C程序運行時的內存結構


 
先驗知識
  1. 靜態變量存儲在靜態存儲區,局部變量存儲在動態存儲區(棧),代碼存放在代碼區
  2. 寄存器,EBP指向棧底,ESP指向棧頂,EIP指向正在執行指令的下一條指令,三個寄存器中保存的都是地址,32位系統,地址為4個字節即dword
  3. 所有寫在函數定義里面的語句都編譯成指令(驅動CPU)

實驗代碼

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
#include <stdio.h>
int fun( int a, int b);
int m = 10;
int main()
{
     int i = 4;
     int j = 5;
     m = fun(i, j);
}
int fun( int a, int b)
{
     int c = 0;
     c = a + b;
     return c;
}

這段代碼包含兩個函數,因此可以測試函數調用,此外還包含了靜態變量、局部變量、返回值等

實驗測試

測試工具:VC6.0
源代碼及對應的匯編如下
寄存器及內存狀態如下
 
EBP棧頂初始值為0018FF84h,ESP初始為0018FF48h

ESP和EBP在棧中的作用

在每個函數最開始的地方有兩條語句

 

1
2
push ebp
mov  ebp,esp

在函數返回前也有兩條語句

 

1
2
mov esp,ebp
pop ebp

每運行一個函數就新開一段棧空間,所謂的開棧空間就是移動ebp棧底,在移動ebp之前,通過push ebp保存上一級函數的棧底,然后用ebp指向現在函數棧的棧頂,即為當前函數開辟了棧;接着給局部變量進行地址分配以及保存現場等,esp不斷向低地址移動,當函數調用結束時,esp指回當前函數的棧頂(mov esp,ebp),然后上一級函數的棧頂地址出棧保存在ebp中(pop ebp)。因此,每一個函數的棧頂上面都保存着上一級函數的棧頂地址,用於當前函數結束時能夠返回上一級函數的棧,通過ebp和esp以及壓棧出棧操作對棧進行維護。

逐條分析

main函數對應的匯編代碼如下

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
7:    int main()
8:    {
00401020   push        ebp                        // ebp初始為0018FF84h壓棧,壓棧后esp = 0018FF48h - 4 = 0018FF44h
00401021   mov         ebp,esp                    // ebp保存棧頂0,ebp=esp=0018FF44h
00401023   sub         esp,48h                    // esp -= 48h開辟了一段棧空間,留待后面保存局部變量,此時esp=0018FF44h-48h=0018FEFCh
00401026   push        ebx                       
00401027   push        esi
00401028   push        edi                        // ebx、esi和edi壓棧,esp = 0018FEFCh - 4*3 = 0018FEF0h
00401029   lea         edi,[ebp-48h]              // lea指令將ebp-48h作為偏移地址保存在edi中,edi=0018FEFCh,即棧中ebx的上面
0040102C   mov         ecx,12h                   
00401031   mov         eax,0CCCCCCCCh
00401036   rep stos    dword ptr [edi]            // 將eax重復保存在以edi開始的棧空間里,重復次數為ecx次,向高地址方向,共覆蓋12h*4=48h個地址,即棧中保存ebx的地址以上到ebp指向的地址這一段全部填充為cch
9:        int i = 4;
00401038   mov         dword ptr [ebp-4],4        // 保存變量i
10:       int j = 5;
0040103F   mov         dword ptr [ebp-8],5        // 保存變量j
11:       m = fun(i, j);
00401046   mov         eax,dword ptr [ebp-8]      // 將j保存在eax中
00401049   push        eax                        // eax壓棧, esp=0018FEF0h-4=0018FEECh
0040104A   mov         ecx,dword ptr [ebp-4]      // 將i保存在ecx中
0040104D   push        ecx                        // ecx壓棧,esp=0018FEECh-4=0018FEE8h
0040104E   call        @ILT+0(_fun) (00401005)    // 以上實際上是為形參分配內存,順序從右到左,此步進行函數跳轉
00401053   add         esp,8                      // 形參的地址回收,esp=0018FEE8h+8=0018FEF0h
00401056   mov         [_m (00424a30)],eax        // 返回值存放在靜態變量m中
12:       return 0;
0040105B   xor         eax,eax                    // 返回值置為0
13:   }
0040105D   pop         edi
0040105E   pop         esi
0040105F   pop         ebx
00401060   add         esp,48h
00401063   cmp         ebp,esp
00401065   call        __chkesp (004010d0)
0040106A   mov         esp,ebp
0040106C   pop         ebp
0040106D   ret

fun函數的匯編代碼理解

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
15:   int fun( int a, int b)
16:   {
00401090   push        ebp
00401091   mov         ebp,esp
00401093   sub         esp,44h
00401096   push        ebx
00401097   push        esi
00401098   push        edi
00401099   lea         edi,[ebp-44h]
0040109C   mov         ecx,11h
004010A1   mov         eax,0CCCCCCCCh
004010A6   rep stos    dword ptr [edi]            // 以上理解同main函數,ebp壓棧時保存的地址是0018FF44h,即main函數棧開始開始的地方,然后ebp指向當前函數棧開始的地方
17:       int c = 0;
004010A8   mov         dword ptr [ebp-4],0        // 為c分配地址,並賦值
18:       c = a + b;
004010AF   mov         eax,dword ptr [ebp+8]      // 獲得第一個參數
004010B2   add         eax,dword ptr [ebp+0Ch]    // 與第二個參數求和
004010B5   mov         dword ptr [ebp-4],eax      // 結果保存在c中
19:       return c;
004010B8   mov         eax,dword ptr [ebp-4]      // 返回值存放在eax
20:   }
004010BB   pop         edi                        // 現場恢復
004010BC   pop         esi
004010BD   pop         ebx
004010BE   mov         esp,ebp                    // 當前函數棧空間回收,以后可重新分配,esp=0018FEE8h
004010C0   pop         ebp                        // ebp恢復為0018FF44h
004010C1   ret                                    // 返回,等待執行函數調用的下一條指令

調用fun函數時的內存情況

局部變量i和j保存在48h空間的開始位置(高地址),即棧底附近,如下圖
在調用fun函數之前,將形參從右至左依次壓棧,如下圖
call fun函數時執行跳轉
 

補充

  1. 局部變量並不是以壓棧的形式入棧的,而是mov進去的,而且是一次性將地址分配夠(如上的48h和44h個字節)然后一個個mov進去,形參是以壓棧的形式入棧的
  2. 函數返回值是通過寄存器返回的,估計當返回值超出寄存器的表示能力時會通過棧返回(未測試)
  3. 函數調用時,專門有個地方保存着函數的入口地址,到那里進行跳轉執行

參考

實驗代碼來自國科大楊力祥老師的開源編譯器源碼分析課程
 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM