什么是字節對齊?
現代計算機中內存空間都是按照byte划分的,從理論上講似乎對任何類型的變量的訪問可以從任何地址開始,但實際情況是在訪問特定類型變量的時候經常在特 定的內存地址訪問,這就需要各種類型數據按照一定的規則在空間上排列,而不是順序的一個接一個的排放,這就是對齊。
為什么要字節對齊?
字節是否對齊關系到CPU訪問數據時的效率問題,假設一個CPU每次總是從內存中取出4個字節,從內存編號為0的地方開始,現在我定義一個char a
,定義一個int b
,讓他們按順排列在內存中,就是這樣的:
char a
占用1個字節,int a
占用4個字節,CPU每次總是取4個字節,這時我想要取b時,需要先取出0-3,再取出4-7,然后將1-4拼在一起,這樣就需要取兩次,但是,如果我讓char a
和int b
按照特定的順序排列:
這樣我只需要取一次就能將b
取出,提升了CPU的工作效率。
字節對齊的概念和規則
概念:
- 數據類型自身的對齊值:對於char型數據,其自身對齊值為1,對於short型為2,對於int,float類型,其自身對齊值為4,對於double型,其自身對齊值為8(單位字節)。
- 結構體或者類的自身對齊值:其成員中自身對齊值最大的那個值。
- 指定對齊值:
#pragma pack (value)
時的指定對齊值value。 - 數據成員、結構體和類的有效對齊值:自身對齊值和指定對齊值中小的那個值。
規則:
有效對齊值N是最終用來決定數據存放地址方式的值,最重要。
有效對齊N,就是表示“對齊在N上”,也就是說該數據的"存放起始地址%N=0"。而數據結構中的數據變量都是按定義的先后順序來排放的。第一個數據變量的起始地址就是數據結構的起始地址。結構體的成員變量要對齊排放,結構體本身也要根據自身的有效對齊值圓整。
舉例說明
代碼如下
#include <stdio.h>
struct Test
{
char a;
int b;
short c;
};
int main(void)
{
struct Test t = {'a',1,2};
printf("%d \n",sizeof(t));
getchar();
return 0;
}
如果我們不知道字節對齊規則,那么一定會認為這個結構體的大小是這樣的,char類型1個字節,int類型4個字節,short類型2個字節一共7個字節,執行一下看看結果:
執行之后的結果是12,我們先來看一下反匯編代碼:
根據反匯編代碼我們可以看到a,b,c中的值分別存放在ebp-0ch
,ebp-8
,ebp-4
這三個地方,我們到內存中看一下他們是怎么排列的:
可以看到char占用1個字節,int占用4個字節,short占用2個字節,但是並沒有我們想象的那樣緊挨着排放,而是有一定的排放規則。這里就體現出了字節對齊,因為我這里是32位的機器,默認是4字節對齊,下面來詳細的說一下是怎么排列的:
假設基址為0012FF3C,從偏移地址為0的位置開始存放
- 根據上面的字節對齊規則,a是char類型,自身對齊值就是1字節,b是int類型,自身對齊值是4字節,c是short類型,自身對齊值是2字節
- 結構體的自身對齊值:結構體中自身對齊值最大的那個,根據上面的分析這個結構體的自身對齊值為4字節
- 指定對齊值:因為我們沒有指定對齊值,使用的是默認的4字節對齊
- 數據成員有效對齊值:自身對齊值和指定對齊值中小的那個值,a的自身對齊值是1,指定對齊值是4,較小值是1,那么a的對齊值就是1;b的自身對齊值是4,指定對齊值是4,較小值是4,那么a的對齊值就是4;c的自身對齊值是12,指定對齊值是4,較小值是2,那么c的對齊值就是2,假設有一個變量是long類型,那么這個變量的對齊值應該為4.
這樣,a占用1個字節,存放在偏移地址為0的內存,0%1=0,沒有問題。
b占用4個字節,如果將他挨着變量a存放,也就是存放在偏移地址為1的位置,1%4=1,這樣就存在問題了,所以b存放到偏移地址為4的位置,4%4=0。
最后,c占用2個字節,如果將他挨着b存放,也就是存放到偏移地址為8的位置,8%2=0,沒有問題,所以c存放到 偏移地址為8的位置,占兩個字節。
這樣就排列好了,這時,發現a,b,c一共才占用了10個字節,因為結構體還沒有根據自身有效對齊值圓整,根據上面的分析,這個結構體的自身對齊值是4,12%4=0,所以結構體會再占用兩個字節,10和11,也就是A和B,這樣就得出這個結構體的實際大小是12。
當然,除了使用默認的對齊值,我們還可以自己使用#pragma pack (value)
指定對齊值:
#include <stdio.h>
#pragma pack (2)
struct Test
{
char a;
int b;
short c;
};
int main(void)
{
struct Test t = {'a',1,2};
printf("%d \n",sizeof(t));
getchar();
return 0;
}
這將對齊值設置成2,那么a,b,c在內存中的排列方式應該是這樣的:
要注意,這里的int b
的自身對齊值是4字節,有效對齊值是2字節。