從一段代碼的匯編看計算機的工作原理


朱宇軻 + 原創作品轉載請注明出處 + 《Linux內核分析》MOOC課程http://mooc.study.163.com/course/USTC-1000029000

/*-------------------------------------以下內容是課堂筆記,咿呀咿呀呦!------------------------------------------*/

本課主要對計算機的運行原理和匯編語言進行了簡單的介紹。

馮若依曼體系結構即存儲程序計算機,也就是將程序寫在內存中,由CPU通過總線從內存中讀取一條條程序,根據程序的內容執行具體的步驟。

如圖所示

CPU在讀取指令時,通過寄存器IP來指向下一條指令(如果是32位系統,則為EIP)

CPU的寄存器分為通用寄存器、段寄存器、狀態寄存器

四種尋址方式:

movl %eax,%edx     edx=eax                          寄存器尋址

movl $0x123,%edx  edx=0x123                       立即尋址

movl 0x123,%edx    edx=*(int32_t*)0x123        直接尋址

movl (%ebx),%edx   edx=*(int32_t*)ebx           間接尋址

movl 4(%ebx),%edx  edx=*(int32_t*)(ebx+4)    變址尋址

了解pushl、popl、call 0x12345、ret命令

注意:IP寄存器一般不能隨便修改,只能通過call、ret等命令更改!

函數的返回值默認使用EAX寄存器存儲返回給上一級函數

    

/*-------------------------以下內容是實驗分析,咿呀咿呀呦!------------------------------------------*/

     首先寫下這么一段C程序:

 1 //linux.c
 2 int g(x)
 3 {
 4     return x+3;
 5 }
 6 int f(x)
 7 {
 8     return g(x);
 9 }
10 int main()
11 {
12     return f(10)+1;
13 }

  在Linux的環境中輸入如下指令:

gcc –S –o linux.s linux.c -m32

  然后打開linux.s,就可以看到我們匯編后的代碼(直接上截圖了)

 

   將里面以“.”開頭的行去掉(這是為鏈接用的),得到匯編后的代碼:

 1 g:
 2     pushl   %ebp
 3     movl    %esp, %ebp
 4     movl    8(%ebp), %eax
 5     addl    $3, %eax
 6     popl    %ebp
 7     ret
 8 f:
 9     pushl   %ebp
10     movl    %esp, %ebp
11     subl    $4, %esp
12     movl    8(%ebp), %eax
13     movl    %eax, (%esp)
14     call    g
15     leave
16     ret
17 main:
18     pushl   %ebp
19     movl    %esp, %ebp
20     subl    $4, %esp
21     movl    $10, (%esp)
22     call    f
23     addl    $1, %eax
24     leave
25     ret

   接下來我們來分析一下改程序具體的流程。

  程序一開始,CPU的IP寄存器指向匯編代碼的第18行,假設堆棧在內存中的地址分別為0,1,2,3……堆棧基指針寄存器(EBP)和堆棧頂指針寄存器(ESP)均指向堆棧段0處。

  第18~21行首先為main函數開辟新的內存區域,之后將傳的參數10入棧,此時堆棧段如下所示:

  

  然后程序調用call 函數,將IP入棧,IP指向代碼第9行f處。

  在f函數的代碼處,首先為f函數開辟新的內存區域,接着將傳入的參數10賦值給EAX,並將EAX入棧,此時堆棧段內存如下圖:

  程序在此調用call進入g函數。在g函數中,同樣先是開辟內存空間,然后將參數傳給EAX,並將EAX的值加上3。

  之后將EBP出棧,並調用ret命令。此時IP重新指向f函數call之后的命令,堆棧內存的情況如下:

  

  之后就是不斷的調用leave與ret命令,跳出當前的內存區域,回到上一級函數的內存區域中,並將EAX的值加3,直到跳出main函數,至此程序結束。

  從上面的分析中,我覺得可以歸納出以下幾點:

  1.計算機的運行流程確是遵循馮諾依曼框架,CPU將內存中的代碼和數據讀取到自己的寄存器中,再根據一條條命令調用寄存器進行進一步的操作。

  2.在進入每一個程序之前,CPU都會將上一級的EIP和EBP壓棧,相當於為新的函數重新開辟了一段新的內存空間,直到退出函數的時候才將它們出棧。與此同時,將函數的返回值保存在EAX中。

  3.CPU的各個寄存器都有不同的分工,如EIP指向要執行的代碼,EAX存儲返回值等。它們貫穿於整個程序執行流程,自己寫程序時一般不要輕易改動。

  


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM