為何C語言(的函數調用)需要堆棧,而匯編語言卻不需要堆棧


為何C語言(的函數調用)需要堆棧,而匯編語言卻不需要堆棧

之前看了很多關於uboot的分析,其中就有說要為C語言的運行,准備好堆棧。

而自己在Ubootstart.S匯編代碼中,關於系統初始化,也看到有堆棧指針初始化這個動作。但是,從來只是看到有人說系統初始化要初始化堆棧,即正確給堆棧指針sp賦值,但是卻從來沒有看到有人解釋,為何要初始化堆棧。所以,接下來的內容,就是經過一定的探究,試圖來解釋一下,為何要初始化堆棧,即:

為何C語言的函數調用要用到堆棧,而匯編卻不需要初始化堆棧

 

 

要明白這個問題,首先要了解堆棧的作用。

關於堆棧的作用,要詳細講解的話,要很長的篇幅,所以此處只是做簡略介紹。

總的來說,堆棧的作用就是:保存現場/上下文,傳遞參數。

 

1.保存現場/上下文

現場,意思就相當於案發現場,總有一些現場的情況,要記錄下來的,否則被別人破壞掉之后,你就無法恢復現場了。而此處說的現場,就是指CPU運行的時候,用到了一些寄存器,比如r0,r1等等,對於這些寄存器的值,如果你不保存而直接跳轉到子函數中去執行,那么很可能就被其破壞了,因為其函數執行也要用到這些寄存器。

因此,在函數調用之前,應該將這些寄存器等現場,暫時保持起來,等調用函數執行完畢返回后,再恢復現場。這樣CPU就可以正確的繼續執行了。

 

在計算機中,你常可以看到上下文這個詞,對應的英文是context。那么:

1.1.什么叫做上下文context

保存現場,也叫保存上下文。

上下文,英文叫做context,就是上面的文章,和下面的文章,即與你此刻,當前CPU運行有關系的內容,即那些你用到寄存器。所以,和上面的現場,是一個意思。

 

保存寄存器的值,一般用的是push指令,將對應的某些寄存器的值,一個個放到堆棧中,把對應的值壓入到堆棧里面,即所謂的壓棧

然后待被調用的子函數執行完畢的時候,再調用pop,把堆棧中的一個個的值,賦值給對應的那些你剛開始壓棧時用到的寄存器,把對應的值從堆棧中彈出去,即所謂的出棧

 

其中保存的寄存器中,也包括lr的值(因為用bl指令進行跳轉的話,那么之前的pc的值是存在lr中的),然后在子程序執行完畢的時候,再把堆棧中的lr的值pop出來,賦值給pc,這樣就實現了子函數的正確的返回。


2.傳遞參數

C語言進行函數調用的時候,常常會傳遞給被調用的函數一些參數,對於這些C語言級別的參數,被編譯器翻譯成匯編語言的時候,就要找個地方存放一下,並且讓被調用的函數能夠訪問,否則就沒發實現傳遞參數了。對於找個地方放一下,分兩種情況。

一種情況是,本身傳遞的參數就很少,就可以通過寄存器傳送參數。

因為在前面的保存現場的動作中,已經保存好了對應的寄存器的值,那么此時,這些寄存器就是空閑的,可以供我們使用的了,那就可以放參數,而參數少的情況下,就足夠存放參數了,比如參數有2個,那么就用r0r1存放即可。(關於參數1和參數2,具體哪個放在r0,哪個放在r1,就是和APCS中的“在函數調用之間傳遞/返回參數”相關了,APCS中會有詳細的約定。感興趣的自己去研究。)

但是如果參數太多,寄存器不夠用,那么就得把多余的參數堆棧中了。

即,可以用堆棧來傳遞所有的或寄存器放不下的那些多余的參數。


3.舉例分析C語言函數調用是如何使用堆棧的

對於上面的解釋的堆棧的作用顯得有些抽象,此處再用例子來簡單說明一下,就容易明白了:

:

 

  1. arm-inux-objdump –d u-boot > dump_u-boot.txt
復制代碼

 

可以得到dump_u-boot.txt文件。該文件就是中,包含了u-boot中的程序的可執行的匯編代碼,

其中我們可以看到C語言的函數的源代碼,到底對應着那些匯編代碼。

 

下面貼出兩個函數的匯編代碼,

一個是clock_init

另一個是與clock_init在同一C源文件中的,另外一個函數CopyCode2Ram

 

 

  1. 33d0091c <CopyCode2Ram>:
  2. 33d0091c:  e92d4070   push   {r4, r5, r6, lr}
  3. 33d00920:  e1a06000   mov r6, r0
  4. 33d00924:  e1a05001   mov r5, r1
  5. 33d00928:  e1a04002   mov r4, r2
  6. 33d0092c:  ebffffef   bl  33d008f0 <bBootFrmNORFlash>
  7. ... ...
  8. 33d00984:  ebffff14   bl  33d005dc <nand_read_ll>
  9. ... ...
  10. 33d009a8:  e3a00000   mov r0, #0 ; 0x0
  11. 33d009ac:  e8bd8070   pop {r4, r5, r6, pc}
  12. 33d009b0 <clock_init>:
  13. 33d009b0:  e3a02313   mov r2, #1275068416   ; 0x4c000000
  14. 33d009b4:  e3a03005   mov r3, #5 ; 0x5
  15. 33d009b8:  e5823014   str r3, [r2, #20]
  16. ... ...
  17. 33d009f8:  e1a0f00e   mov pc, lr
復制代碼

 

 

1clock_init部分的代碼

可以看到該函數第一行:

 

  1. 33d009b0:  e3a02313   mov r2, #1275068416   ; 0x4c000000
復制代碼

 

就沒有我們所期望的push指令,沒有去將一些寄存器的值放到堆棧中。這是因為,我們clock_init這部分的內容,所用到的r2,r3等等寄存器,和前面調用clock_init之前所用到的寄存器r0,沒有沖突,所以此處可以不用push去保存這類寄存器的值,不過有個寄存器要注意,那就是r14,即lr,其是在前面調用clock_init的時候,用的是bl指令,所以會自動把跳轉時候的pc的值賦值給lr,所以也不需要push指令去將PC的值保存到堆棧中。

clock_init的代碼的最后一行:

 

  1. 33d009f8: e1a0f00e mov pc, lr
復制代碼

 

就是我們常見的mov pc, lr,把lr的值,即之前保存的函數調用時候的PC值,賦值給現在的PC

這樣就實現了函數的正確的返回,即返回到了函數調用時候下一個指令的位置。

這樣CPU就可以繼續執行原先函數內剩下那部分的代碼了。

 

2CopyCode2Ram部分的代碼

其第一行:

 

  1. 33d0091c: e92d4070 push {r4, r5, r6, lr}
復制代碼

 

就是我們所期望的,用push指令,保存了r4,r5,r以及lr

push去保存r4,r5,r6,那是因為所謂的保存現場,以后后續函數返回時候再恢復現場,

而用push去保存lr,那是因為此函數里面,還有其他函數調用:

 

  1. 33d0092c:  ebffffef   bl  33d008f0 <bBootFrmNORFlash>
  2. ... ...
  3. 33d00984:  ebffff14   bl  33d005dc <nand_read_ll>
  4. ... ...
復制代碼

 

也用到了bl指令,會改變我們最開始進入clock_init時候的lr的值,所以我們要用push也暫時保存起來。

而對應地,CopyCode2Ram的最后一行:

  1. 33d009ac: e8bd8070 pop {r4, r5, r6, pc}
復制代碼

 

就是把之前push的值,給pop出來,還給對應的寄存器,其中最后一個是將開始pushlr的值,pop出來給賦給PC,因為實現了函數的返回。

另外,我們注意到,在CopyCode2Ram的倒數第二行是:

  1. 33d009a8: e3a00000 mov r0, #0 ; 0x0
復制代碼

 

是把0賦值給r0寄存器,這個就是我們所謂返回值的傳遞,是通過r0寄存器的。

此處的返回值是0,也對應着C語言的源碼中的“return 0.

 

 

對於使用哪個寄存器來傳遞返回值:

當然你也可以用其他暫時空閑沒有用到的寄存器來傳遞返回值,但是這些處理方式,本身是根據ARMAPCS的寄存器的使用的約定而設計的,你最好不要隨便改變使用方式,最好還是按照其約定的來處理,這樣程序更加符合規范。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM