linux目標文件
一個簡單的程序被編譯成目標文件后的結構如下:
從圖可以看出,已初始化的全局變量和局部靜態變量保存在 .data段中,未初始化的全局變量和未初始化的局部靜態變量保存在 .bss段中。
目標文件各個段在文件中的布局如下:
各個段介紹:
init段:
程序初始化入口代碼,在main() 之前運行。
bss段:
BSS段屬於靜態內存分配。通常是指用來存放程序中未初始化的全局變量和未初始化的局部靜態變量。未初始化的全局變量和未初始化的局部靜態變量默認值是0,本來這些變量也可以放到data段的,但是因為他們都是0,所以為他們在data段分配空間並且存放數據0是沒有必要的。
程序在運行時,才會給BSS段里面的變量分配內存空間。
在目標文件(*.o)和可執行文件中,BSS段只是為未初始化的全局變量和未初始化的局部靜態變量預留位置而已,它並沒有內容,所以它不占據空間。
section table中保存了BSS段(未初始化的全局變量和未初始化的局部靜態變量)內存空間大小總和。 (objdump -h *.o 命令可以看到)
data段:
數據段(datasegment)通常是指用來存放程序中已初始化的全局變量和已初始化的靜態變量的一塊內存區域。數據段屬於靜態內存分配。
text段:
代碼段(codesegment/textsegment)通常是指用來存放程序執行代碼的一塊內存區域。這部分區域的大小在程序運行前就已經確定,並且內存區域通常屬於只讀,某些架構也允許代碼段為可寫,即允許修改程序。在代碼段中,也有可能包含一些只讀的常數變量,例如字符串常量等。
rodata段:
存放的是只讀數據,比如字符串常量,全局const變量 和 #define定義的常量。例如: char*p="123456", "123456"就存放在rodata段中。
strtab段:
存儲的是變量名,函數名等。例如: char* szPath="/root",void func() 變量名szPath 和函數名func 存儲在strtab段里。
shstrtab段:
bss,text,data等段名也存儲在這里。
rel.text段:
針對 text段的重定位表,還有 rel.data(針對data段的重定位表)
heap堆:
堆是用於存放進程運行中被動態分配的內存段,它的大小並不固定,可動態擴張或縮減。當進程調用malloc等函數分配內存時,新分配的內存就被動態添加到堆上(堆被擴張);當利用free等函數釋放內存時,被釋放的內存從堆中被剔除(堆被縮減)
stack棧:
是用戶存放程序臨時創建的局部變量,也就是說我們函數括弧“{}”中定義的變量(但不包括static聲明的變量,static意味着在數據段中存放變量)。除此以外,在函數被調用時,其參數也會被壓入發起調用的進程棧中,並且待到調用結束后,函數的返回值也會被存放回棧中。由於棧的先進先出特點,所以棧特別方便用來保存/恢復調用現場。從這個意義上講,我們可以把堆棧看成一個寄存、交換臨時數據的內存區。
驗證BSS內存空間
程序1:
int ar[30000];
void main()
{
......
}
程序2:
int ar[300000] = {1, 2, 3, 4, 5, 6 };
void main()
{
......
}
結論是:程序2編譯之后所得的.exe文件比程序1的要大得多。 為什么?
區別很明顯,一個位於.bss段,而另一個位於.data段,兩者的區別在於:
l 全局的未初始化變量存在於.bss段中,具體體現為一個占位符;全局的已初始化變量存於.data段中;
l 而函數內的自動變量都在棧上分配空間。
l .bss是不占用.exe文件空間的,其內容由操作系統初始化(清零);
l 而.data卻需要占用,其內容由程序初始化,因此造成了上述情況。
注意:
1. bss段(未手動初始化的數據)並不給該段的數據分配空間. 程序運行后,系統分配內存空間並由系統初始化,默認內存空間的值都為0. section table中保存了BSS段(未初始化的全局變量和未初始化的局部靜態變量)內存空間大小總和,所以程序運行后,系統知道該分配多少內存給BSS段。
2. data(已手動初始化的數據)段則為數據分配空間,數據保存在目標文件中。
這里有個疑問: data段是變量的內存空間,那是如何區分哪幾個字節是變量a的? 哪幾個字節是變量b的? 因為變量a,b的內存空間是在一起的,如果你不告訴他們的類型,我們的確是不知道變量a有幾個字節,變量b有幾個字節。
那么哪里保存了 變量a,b的類型了? 查資料發現,text代碼段中調用a的匯編代碼,是會告訴我們變量a的類型的,這樣我們就知道讀取哪幾個字節的值了。 程序運行起來后,BSS段中變量內存數據讀取原理類似。