宋寶華
21cnbao sweek@21cn.com
試題一:編寫一段程序判斷系統中的CPU是Little endian還是Big endian模式?
分析:
作為一個計算機相關專業的人,我們應該在計算機組成中都學習過什么叫Little endian和Big endian。Little endian和Big endian是CPU存放數據的兩種不同順序。對於整型、長整型等數據類型,Big endian認為第一個字節是最高位字節(按照從低地址到高地址的順序存放數據的高位字節到低位字節);而Little endian則相反,它認為第一個字節是最低位字節(按照從低地址到高地址的順序存放數據的低位字節到高位字節)。
例如,假設從內存地址0x0000開始有以下數據:
0x0000
|
0x0001
|
0x0002
|
0x0003
|
0x12
|
0x34
|
0xab
|
0xcd
|
如果我們去讀取一個地址為0x0000的四個字節變量,若字節序為big-endian,則讀出結果為0x1234abcd;若字節序位little-endian,則讀出結果為0xcdab3412。如果我們將0x1234abcd寫入到以0x0000開始的內存中,則Little endian和Big endian模式的存放結果如下:
地址
|
0x0000
|
0x0001
|
0x0002
|
0x0003
|
big-endian
|
0x12
|
0x34
|
0xab
|
0xcd
|
little-endian
|
0xcd
|
0xab
|
0x34
|
0x12
|
一般來說,x86系列CPU都是little-endian的字節序,PowerPC通常是Big endian,還有的CPU能通過跳線來設置CPU工作於Little endian還是Big endian模式。
解答:
顯然,解答這個問題的方法只能是將一個字節(CHAR/BYTE類型)的數據和一個整型數據存放於同樣的內存開始地址,通過讀取整型數據,分析CHAR/BYTE數據在整型數據的高位還是低位來判斷CPU工作於Little endian還是Big endian模式。得出如下的答案:
typedef unsigned char BYTE;
int main(int argc, char* argv[])
{
unsigned int num,*p;
p = #
num = 0;
*(BYTE *)p = 0xff;
if(num == 0xff)
{
printf("The endian of cpu is little\n");
}
else //num == 0xff000000
{
printf("The endian of cpu is big\n");
}
return 0;
}
除了上述方法(通過指針類型強制轉換並對整型數據首字節賦值,判斷該賦值賦給了高位還是低位)外,還有沒有更好的辦法呢?我們知道,union的成員本身就被存放在相同的內存空間(共享內存,正是union發揮作用、做貢獻的去處),因此,我們可以將一個CHAR/BYTE數據和一個整型數據同時作為一個union的成員,得出如下答案:
int checkCPU()
{
{
union w
{
int a;
char b;
} c;
c.a = 1;
return (c.b == 1);
}
}
實現同樣的功能,我們來看看Linux操作系統中相關的源代碼是怎么做的:
static union { char c[4]; unsigned long l; } endian_test = { { 'l', '?', '?', 'b' } };
#define ENDIANNESS ((char)endian_test.l)
Linux的內核作者們僅僅用一個union變量和一個簡單的宏定義就實現了一大段代碼同樣的功能!由以上一段代碼我們可以深刻領會到Linux源代碼的精妙之處!
試題二:假設網絡節點A和網絡節點B中的通信協議涉及四類報文,報文格式為“報文類型字段+報文內容的結構體”,四個報文內容的結構體類型分別為STRUCTTYPE1~ STRUCTTYPE4,請編寫程序以最簡單的方式組織一個統一的報文數據結構。
分析:
報文的格式為“報文類型+報文內容的結構體”,在真實的通信中,每次只能發四類報文中的一種,我們可以將四類報文的結構體組織為一個union(共享一段內存,但每次有效的只是一種),然后和報文類型字段統一組織成一個報文數據結構。
解答:
根據上述分析,我們很自然地得出如下答案:
typedef unsigned char BYTE;
//報文內容聯合體
typedef union tagPacketContent
{
STRUCTTYPE1 pkt1;
STRUCTTYPE2 pkt2;
STRUCTTYPE3 pkt1;
STRUCTTYPE4 pkt2;
}PacketContent;
//統一的報文數據結構
typedef struct tagPacket
{
BYTE pktType;
PacketContent pktContent;
}Packet;
總結
在C/C++程序的編寫中,當多個基本數據類型或復合數據結構要占用同一片內存時,我們要使用聯合體(試題一是這樣的例證);當多種類型,多個對象,多個事物只取其一時(我們姑且通俗地稱其為“n選1”),我們也可以使用聯合體來發揮其長處(試題二是這樣的例證)。
本文出自 “宋寶華的博客” 博客,請務必保留此出處http://21cnbao.blog.51cto.com/109393/120108