為何C語言（的函數調用）需要堆棧，而匯編語言卻不需要堆棧

本文轉載自查看原文 2012-04-07 10:42 3279 C語言堆棧匯編語言/ C語言百問

之前看了很多關於uboot的分析，其中就有說要為C語言的運行，准備好堆棧。

而自己在Uboot的start.S匯編代碼中，關於系統初始化，也看到有堆棧指針初始化這個動作。但是，從來只是看到有人說系統初始化要初始化堆棧，即正確給堆棧指針sp賦值，但是卻從來沒有看到有人解釋，為何要初始化堆棧。所以，接下來的內容，就是經過一定的探究，試圖來解釋一下，為何要初始化堆棧，即：

為何C語言的函數調用要用到堆棧，而匯編卻不需要初始化堆棧。

要明白這個問題，首先要了解堆棧的作用。

關於堆棧的作用，要詳細講解的話，要很長的篇幅，所以此處只是做簡略介紹。

總的來說，堆棧的作用就是：保存現場/上下文，傳遞參數。

1.保存現場/上下文

現場，意思就相當於案發現場，總有一些現場的情況，要記錄下來的，否則被別人破壞掉之后，你就無法恢復現場了。而此處說的現場，就是指CPU運行的時候，用到了一些寄存器，比如r0,r1等等，對於這些寄存器的值，如果你不保存而直接跳轉到子函數中去執行，那么很可能就被其破壞了，因為其函數執行也要用到這些寄存器。

因此，在函數調用之前，應該將這些寄存器等現場，暫時保持起來，等調用函數執行完畢返回后，再恢復現場。這樣CPU就可以正確的繼續執行了。

在計算機中，你常可以看到上下文這個詞，對應的英文是context。那么：

1.1.什么叫做上下文context

保存現場，也叫保存上下文。

上下文，英文叫做context，就是上面的文章，和下面的文章，即與你此刻，當前CPU運行有關系的內容，即那些你用到寄存器。所以，和上面的現場，是一個意思。

保存寄存器的值，一般用的是push指令，將對應的某些寄存器的值，一個個放到堆棧中，把對應的值壓入到堆棧里面，即所謂的壓棧。

然后待被調用的子函數執行完畢的時候，再調用pop，把堆棧中的一個個的值，賦值給對應的那些你剛開始壓棧時用到的寄存器，把對應的值從堆棧中彈出去，即所謂的出棧。

其中保存的寄存器中，也包括lr的值（因為用bl指令進行跳轉的話，那么之前的pc的值是存在lr中的），然后在子程序執行完畢的時候，再把堆棧中的lr的值pop出來，賦值給pc，這樣就實現了子函數的正確的返回。

2.傳遞參數

C語言進行函數調用的時候，常常會傳遞給被調用的函數一些參數，對於這些C語言級別的參數，被編譯器翻譯成匯編語言的時候，就要找個地方存放一下，並且讓被調用的函數能夠訪問，否則就沒發實現傳遞參數了。對於找個地方放一下，分兩種情況。

一種情況是，本身傳遞的參數就很少，就可以通過寄存器傳送參數。

因為在前面的保存現場的動作中，已經保存好了對應的寄存器的值，那么此時，這些寄存器就是空閑的，可以供我們使用的了，那就可以放參數，而參數少的情況下，就足夠存放參數了，比如參數有2個，那么就用r0和r1存放即可。（關於參數1和參數2，具體哪個放在r0，哪個放在r1，就是和APCS中的“在函數調用之間傳遞/返回參數”相關了，APCS中會有詳細的約定。感興趣的自己去研究。）

但是如果參數太多，寄存器不夠用，那么就得把多余的參數堆棧中了。

即，可以用堆棧來傳遞所有的或寄存器放不下的那些多余的參數。

3.舉例分析C語言函數調用是如何使用堆棧的

對於上面的解釋的堆棧的作用顯得有些抽象，此處再用例子來簡單說明一下，就容易明白了：

用:

arm-inux-objdump –d u-boot > dump_u-boot.txt

復制代碼

可以得到dump_u-boot.txt文件。該文件就是中，包含了u-boot中的程序的可執行的匯編代碼，

其中我們可以看到C語言的函數的源代碼，到底對應着那些匯編代碼。

下面貼出兩個函數的匯編代碼，

一個是clock_init，

另一個是與clock_init在同一C源文件中的，另外一個函數CopyCode2Ram：

33d0091c <CopyCode2Ram>:
33d0091c: e92d4070 push {r4, r5, r6, lr}
33d00920: e1a06000 mov r6, r0
33d00924: e1a05001 mov r5, r1
33d00928: e1a04002 mov r4, r2
33d0092c: ebffffef bl 33d008f0 <bBootFrmNORFlash>
... ...
33d00984: ebffff14 bl 33d005dc <nand_read_ll>
... ...
33d009a8: e3a00000 mov r0, #0 ; 0x0
33d009ac: e8bd8070 pop {r4, r5, r6, pc}
33d009b0 <clock_init>:
33d009b0: e3a02313 mov r2, #1275068416 ; 0x4c000000
33d009b4: e3a03005 mov r3, #5 ; 0x5
33d009b8: e5823014 str r3, [r2, #20]
... ...
33d009f8: e1a0f00e mov pc, lr

復制代碼

（1）clock_init部分的代碼

可以看到該函數第一行：

33d009b0: e3a02313 mov r2, #1275068416 ; 0x4c000000

復制代碼

就沒有我們所期望的push指令，沒有去將一些寄存器的值放到堆棧中。這是因為，我們clock_init這部分的內容，所用到的r2,r3等等寄存器，和前面調用clock_init之前所用到的寄存器r0，沒有沖突，所以此處可以不用push去保存這類寄存器的值，不過有個寄存器要注意，那就是r14，即lr，其是在前面調用clock_init的時候，用的是bl指令，所以會自動把跳轉時候的pc的值賦值給lr，所以也不需要push指令去將PC的值保存到堆棧中。

而clock_init的代碼的最后一行:

33d009f8: e1a0f00e mov pc, lr

復制代碼

就是我們常見的mov pc, lr，把lr的值，即之前保存的函數調用時候的PC值，賦值給現在的PC，

這樣就實現了函數的正確的返回，即返回到了函數調用時候下一個指令的位置。

這樣CPU就可以繼續執行原先函數內剩下那部分的代碼了。

（2）CopyCode2Ram部分的代碼

其第一行：

33d0091c: e92d4070 push {r4, r5, r6, lr}

復制代碼

就是我們所期望的，用push指令，保存了r4,r5,r以及lr。

用push去保存r4,r5,r6，那是因為所謂的保存現場，以后后續函數返回時候再恢復現場，

而用push去保存lr，那是因為此函數里面，還有其他函數調用：

33d0092c: ebffffef bl 33d008f0 <bBootFrmNORFlash>
... ...
33d00984: ebffff14 bl 33d005dc <nand_read_ll>
... ...

復制代碼

也用到了bl指令，會改變我們最開始進入clock_init時候的lr的值，所以我們要用push也暫時保存起來。

而對應地，CopyCode2Ram的最后一行：

33d009ac: e8bd8070 pop {r4, r5, r6, pc}

復制代碼

就是把之前push的值，給pop出來，還給對應的寄存器，其中最后一個是將開始push的lr的值，pop出來給賦給PC，因為實現了函數的返回。

另外，我們注意到，在CopyCode2Ram的倒數第二行是：

33d009a8: e3a00000 mov r0, #0 ; 0x0

復制代碼

是把0賦值給r0寄存器，這個就是我們所謂返回值的傳遞，是通過r0寄存器的。

此處的返回值是0，也對應着C語言的源碼中的“return 0”.

對於使用哪個寄存器來傳遞返回值：

當然你也可以用其他暫時空閑沒有用到的寄存器來傳遞返回值，但是這些處理方式，本身是根據ARM的APCS的寄存器的使用的約定而設計的，你最好不要隨便改變使用方式，最好還是按照其約定的來處理，這樣程序更加符合規范。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 [匯編與C語言關系]1.函數調用 c++運用backtrace追蹤函數調用的堆棧函數調用的匯編解釋 C/C++ 反匯編：關於函數調用約定 c語言是如何處理函數調用的？【C語言】函數調用的簡單例子【C語言】無參函數調用實例 C語言函數調用棧(二) C++反匯編代碼分析–函數調用函數調用中堆棧的個人理解