C/C++中編譯程序的內存結構分布

本文轉載自查看原文 2021-06-08 15:50 1509

內存分配方式簡介

在C++中，內存分成5個區，他們分別是堆、棧、自由存儲區、全局/靜態存儲區和常量存儲區。

1、棧，在執行函數時，函數內局部變量的存儲單元都可以在棧上創建，函數執行結束時這些存儲單元自動被釋放。棧內存分配運算內置於處理器的指令集中，效率很高，但是分配的內存容量有限。

2、堆，就是那些由new分配的內存塊，他們的釋放編譯器不去管，由我們的應用程序去控制，一般一個new就要對應一個delete。如果程序員沒有釋放掉，那么在程序結束后，操作系統會自動回收。

3、自由存儲區，就是那些由malloc等分配的內存塊，他和堆是十分相似的，不過它是用free來結束自己的生命的。

4、全局/靜態存儲區，全局變量和靜態變量被分配到同一塊內存中，在以前的C語言中，全局變量又分為初始化的和未初始化的，在C++里面沒有這個區分了，他們共同占用同一塊內存區。

5、常量存儲區，這是一塊比較特殊的存儲區，他們里面存放的是常量，不允許修改。關鍵字時const

注意：

1.在所有函數體外定義的是全局變量

2.加了static修飾符后不管在哪里都存放在全局區（靜態區）

3.在所有函數體外定義的static變量表示在該文件中有效，不能extern到別的文件用

4.在函數體內定義的static表示只在該函數體內有效

5.函數中的常量字符串存放在常量區

為什么需要知道C/C++的內存布局和在哪可以可以找到想要的數據？知道內存布局對調試程序非常有幫助，可以知道程序執行時，到底做了什么，有助於寫出干凈的代碼。

源文件轉換為可執行文件

源文件經過以下幾步生成可執行文件：

1、預處理（preprocessor）：對#include、#define、#ifdef/#endif、#ifndef/#endif等進行處理

2、編譯（compiler）：將源碼編譯為匯編代碼

3、匯編（assembler）：將匯編代碼匯編為目標代碼

4、鏈接（linker）：將目標代碼鏈接為可執行文件

編譯器和匯編器創建的目標文件包含：二進制代碼（指令）、源碼中的數據；鏈接器將多個目標文件鏈接成一個；裝載器吧目標文件加載到內存。

可執行程序組成及內存布局

通過上面的小節，我們知道將源程序轉換為可執行程序的步驟，典型的可執行文件分為兩部分：

代碼段（Code），由機器指令組成，該部分是不可改的，編譯之后就不再改變，放置在文本段（.text）。

數據段（Data），它由以下幾部分組：

常量（constant），通常放置在只讀read-only的文本段（.text）

靜態數據（static data），初始化的放置在數據段（.data）；未初始化的放置在（.bss，Block Started by Symbol，BSS段的變量只有名稱和大小卻沒有值）

動態數據（dynamic data），這些數據存儲在堆（heap）或棧（stack）

源程序編譯后鏈接到一個以0地址為始地址的線性或多維虛擬地址空間。而且每個進程都擁有這樣一個空間，每個指令和數據都在這個虛擬地址空間擁有確定的地址，把這個地址稱為虛擬地址（Virtual Address）。將進程中的目標代碼、數據等的虛擬地址組成的虛擬空間稱為虛擬存儲器（Virtual Memory）。典型的虛擬存儲器中有類似的布局：

當進程被創建時，內核為其提供一塊物理內存，將虛擬內存映射到物理內存，這些都是由操作系統來做的。

數據存儲類別

討論C/C++中的內存布局，不得不提的是數據的存儲類別！數據在內存中的位置取決於它的存儲類別。一個對象是內存的一個位置，解析這個對象依賴於兩個屬性：存儲類別、數據類型。

存儲類別決定對象在內存中的生命周期。

數據類型決定對象值的意義，在內存中占多大空間。

C/C++中由（auto、 extern、 register、 static）存儲類別和對象聲明的上下文決定它的存儲類別。

1、自動對象（automatic objects）

auto和register將聲明的對象指定為自動存儲類別。他們的作用域是局部的，諸如一個函數內，一個代碼塊{***}內等。操作了作用域，對象會被銷毀。

在一個代碼塊中聲明一個對象，如果沒有執行auto，那么默認是自動存儲類別。

聲明為register的對象是自動存儲類別，存儲在計算機的快速寄存器中。不可以對register對象做取值操作“&”。

2、靜態對象（static objects）

靜態對象可以局部的，也可以是全局的。靜態對象一直保持它的值，例如進入一個函數，函數中的靜態對象仍保持上次調用時的值。包含靜態對象的函數不是線程安全的、不可重入的，正是因為它具有“記憶”功能。

局部對象聲明為靜態之后，將改變它在內存中保存的位置，由動態數據--->靜態數據，即從堆或棧變為數據段或bbs段。

全局對象聲明為靜態之后，而不會改變它在內存中保存的位置，仍然是在數據段或bbs段。但是static將改變它的作用域，即該對象僅在本源文件有效。此相反的關鍵字是extern，使用extern修飾或者什么都不帶的全局對象的作用域是整個程序。

C/C++中由源程序到可執行文件的步驟，和可執行程序的內存布局，數據存儲類別，最后還通過一個例子來說明。可執行程序中的變量在內存中的布局可以總結為如下：

變量（函數外）：如果未初始化，則存放在BSS段；否則存放在data段

變量（函數內）：如果沒有指定static修飾符，則存放在棧中；否則同上

常量：存放在文本段.text

函數參數：存放在棧或寄存器中

內存可以分為以下幾段：

文本段：包含實際要執行的代碼（機器指令）和常量。它通常是共享的，多個實例之間共享文本段。文本段是不可修改的。

初始化數據段：包含程序已經初始化的全局變量，.data。

未初始化數據段：包含程序未初始化的全局變量，.bbs。該段中的變量在執行之前初始化為0或NULL。

棧：由系統管理，由高地址向低地址擴展。

堆：動態內存，由用戶管理。通過malloc/alloc/realloc、new/new[]申請空間，通過free、delete/delete[]釋放所申請的

空間。由低地址想高地址擴展

堆和棧的比較

申請方式

stack: 由系統自動分配。

heap: 需要程序員自己申請，並指明大小，在 C 中用malloc 函數， C++ 中是 new 運算符。

申請后系統的響應

棧：只要棧的剩余空間大於所申請空間，系統將為程序提供內存，否則將報異常提示棧溢出。

堆：首先應該知道操作系統有一個記錄空閑內存地址的鏈表，當系統收到程序的申請時，會遍歷該鏈表，尋找第一個空間大於所申請空間的堆結點，然后將該結點從空閑結點鏈表中刪除，並將該結點的空間分配給程序。

對於大多數系統，會在這塊內存空間中的首地址處記錄本次分配的大小，這樣，代碼中的 delete 語句才能正確的釋放本內存空間。

由於找到的堆結點的大小不一定正好等於申請的大小，系統會自動的將多余的那部分重新放入空閑鏈表中。

申請大小的限制

棧：在Windows下，棧是向低地址擴展的數據結構，是一塊連續的內存的區域。意思是棧頂的地址和棧的最大容量是系統預先規定好的，在Windows下，棧的大小是 2M （也有的說是 1M ，總之是一個編譯時就確定的常數），如果申請的空間超過棧的剩余空間時，將提示overflow。因此，能從棧獲得的空間較小。

堆：堆是向高地址擴展的數據結構，是不連續的內存區域。這是由於系統是用鏈表來存儲的空閑內存地址的，自然是不連續的，而鏈表的遍歷方向是由低地址向高地址。堆的大小受限於計算機系統中有效的虛擬內存。由此可見，堆獲得的空間比較靈活，也比較大。

申請效率的比較

棧由系統自動分配，速度較快。但程序員是無法控制的。

堆是由 new 分配的內存，一般速度比較慢，而且容易產生內存碎片 , 不過用起來方便。

堆和棧中的存儲內容

棧：在函數調用時，第一個進棧的是主函數中后的下一條指令（函數調用語句的下一條可執行語句）的地址，然后是函數的各個參數，在大多數的 C 編譯器中，參數是由右往左入棧的，然后是函數中的局部變量。注意靜態變量是不入棧的。

當本次函數調用結束后，局部變量先出棧，然后是參數，最后棧頂指針指向最開始存的地址，也就是主函數中的下一條指令，程序由該點繼續運行。

堆：一般是在堆的頭部用一個字節存放堆的大小。堆中的具體內容有程序員安排。

存取效率的比較 參考：https://blog.csdn.net/baidu_37964071/article/details/81428139

一個由C/C++編譯的程序占用的內存分為以下幾個部分

1、棧區（stack）— 由編譯器自動分配釋放，存放函數的參數值，局部變量的值等。其操作方式類似於數據結構中的棧。

2、堆區（heap） — 一般由程序員分配釋放，若程序員不釋放，程序結束時可能由OS回收。

3、全局區（靜態區）（static）—，全局變量和靜態變量的存儲是放在一塊的，初始化的全局變量和靜態變量在一塊區域，未初始化的全局變量和未初始化的靜態變量在相鄰的另一塊區域。 - 程序結束后有系統釋放

4、常量存儲區 —常量字符串就是放在這里的。程序結束后由系統釋放

5、程序代碼區—存放函數體的二進制代碼。

————————————————

//main.cpp

int a = 0; // 全局初始化區

char *p1; // 全局未初始化區

const int b = 10; // 變量將在常量存儲區，程序執行的全程不能修改

char * p2 = new char[9]; // 這個是聲明的一個動態變量，將存放在動態存儲區，在程序運行時分配內存

// get dynamic memory:

int main()

{

// 在這個代碼塊里定義的變量都是定義在了棧上，隨着程序的結束這里的變量將被全部釋放

int b; // 棧

char s[] = "abc"; // 棧

char *p2; // 棧

char *p3 = "123456"; // 123456\0在常量區，p3在棧上。

static int c =0； // static關鍵字在哪里都可以讓一個變量成為全局（靜態）變量，初始化區

p1 = (char *)malloc(10);

p2 = (char *)malloc(20);

// 分配得來得10和20字節的區域就在堆區。

strcpy(p1, "123456"); // 123456\0放在常量區，編譯器可能會將它與p3所指向的"123456"優化成一個地方。

return 0;

}

————————————————

編譯其實只是一個掃描過程，進行詞法語法檢查，代碼優化而已，編譯程序越好，程序運行的時候越高效。

我想你說的“編譯時分配內存”是指“編譯時賦初值”，它只是形成一個文本，檢查無錯誤，並沒有分配內存空間。類似一個占位符的檢查，你在的位置對嗎，這個位置該你占位嘛。

當你運行時，系統才把程序導入內存。一個進程（即運行中的程序）在主要包括以下五個分區：

棧、堆、bss、data、code

代碼（編譯后的二進制代碼）放在code區，代碼中生成的各種變量、常量按不同類型分別存放在其它四個區。系統依照代碼順序執行，然后依照代碼方案改變或調用數據，這就是一個程序的運行過程。

運行時程序是必須調到“內存”的。因為CPU（其中有多個寄存器）只與內存打交道的。程序在進入實際內存之前要首先分配物理內存。

編譯

編譯器能夠識別語法，數據類型等等。然后逐行逐句檢查編譯成二進制數據的obj文件，然后再由鏈接程序將其鏈接成一個EXE文件。此時的程序是以EXE文件的形式存放在磁盤上。

運行

當執行這個EXE文件以后，此程序就被加載到內存中，成為進程。此時一開始程序會初始化一些全局對象，然后找到入口函數（main()或者WinMain()），就開始按程序的執行語句開始執行。此時需要的內存只能在程序的堆上進行動態增加/釋放了。

參考：https://blog.csdn.net/qq_42570601/article/details/107598826

https://blog.csdn.net/ct2008112101/article/details/38680829

1.棧（stack）:1.由編譯器自動分配釋放，存放函數的參數值，局部變量。函數被調用時用來傳遞參數和返回值

2.其他操作類似於數據結構中的棧

2.堆（heap）:存放動態分布的內存段當進程調用malloc/free等函數分配內存時，新分配的內存就被動態添加到堆上（堆被被擴張）/釋放的內存從堆中被提出（堆被縮減）。堆一般由程序員分配釋放，若程序員不釋放，程序結束時可能由OS回收。注意它與數據結構中的堆是兩回事，分配方式倒是類似於鏈表。

3.全局數據區：全局變量和靜態變量是放在一塊，初始化后的全局變量和靜態變量在一塊區域，沒有初始化的全局變量和靜態變量在一塊區域。文字常量和常量字符串在這塊區域，程序結束后被系統釋放

（1）BSS段：存放未初始化的全局變量

(2) 數據段：已初始化的全局變量

4.代碼段：存放程序執行代碼的一塊區域。程序段為程序代碼在內存中的映射，一個程序可以在內存中有多個副本

注意：

在所有函數體外定義的是全局變量
加了static修飾符后不管在哪里都存放在全局區（靜態區）
在所有函數體外定義的static變量表示在該文件中有效，不能extern到別的文件用
在函數體內定義的static表示只在該函數體內有效
函數中的常量字符串存放在常量區

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 如何判斷一段程序是由C 編譯程序還是由C++編譯程序編譯的編譯程序結構框圖 C程序中的內存分布 MDK中編譯程序后Program Size詳解 C++類的內存分布 Java編譯程序和運行過程詳解 Golang的跨平台編譯程序 C++類的內存結構發現C++程序中未釋放的內存空間 gcc編譯C++程序