c 結構體中的變長數組


在Linux系統里,/usr/include/linux/if_pppox.h里面有這樣一個結構:

struct pppoe_tag {

    __u16 tag_type;

    __u16 tag_len;

    char tag_data[0];

} __attribute ((packed));

 

最后一個成員為可變長的數組,對於TLV(Type-Length-Value)形式的結構,或者其他需要變長度的結構體,用這種方式定義最好。使用起來非常方便,創建時,malloc一段結構體大小加上可變長數據長度的空間給它,可變長部分可按數組的方式訪問,釋放時,直接把整個結構體free掉就可以了。例子如下:

struct pppoe_tag *sample_tag;

__u16 sample_tag_len = 10;

sample_tag = (struct pppoe_tag *)malloc(sizeof(struct pppoe_tag)+sizeof(char)*sample_tag_len);

sample_tag->tag_type = 0xffff;

sample_tag->tag_len = sample_tag_len;

sample_tag->tag_data[0]=....

 

...

釋放時,

free(sample_tag)

是否可以用 char *tag_data 代替呢?其實它和 char *tag_data 是有很大的區別,為了說明這個問題,我寫了以下的程序:

例:test_size.c

10  struct tag1

20  {

30      int a;

40      int b;

50  }__attribute ((packed));

60

70  struct tag2

80  {

90      int a;

100     int b;

110     char *c;

120  }__attribute ((packed));

130

140  struct tag3

150  {

160      int a;

170      int b;

180      char c[0];

190  }__attribute ((packed));

200

210  struct tag4

220  {

230      int a;

240      int b;

250      char c[1];

260  }__attribute ((packed));

270

280  int main()

290  {

300      struct tag2 l_tag2;

310      struct tag3 l_tag3;

320      struct tag4 l_tag4;

330

340      memset(&l_tag2,0,sizeof(struct tag2));

350      memset(&l_tag3,0,sizeof(struct tag3));

360      memset(&l_tag4,0,sizeof(struct tag4));

370

380      printf("size of tag1 = %d\n",sizeof(struct tag1));

390      printf("size of tag2 = %d\n",sizeof(struct tag2));

400      printf("size of tag3 = %d\n",sizeof(struct tag3));

410

420      printf("l_tag2 = %p,&l_tag2.c = %p,l_tag2.c = %p\n",&l_tag2,&l_tag2.c,l_tag2.c);

430      printf("l_tag3 = %p,l_tag3.c = %p\n",&l_tag3,l_tag3.c);

440      printf("l_tag4 = %p,l_tag4.c = %p\n",&l_tag4,l_tag4.c);

450      exit(0);

460  }

 

__attribute ((packed)) 是為了強制不進行字節對齊,這樣比較容易說明問題。

程序的運行結果如下:

size of tag1 = 8

size of tag2 = 12

size of tag3 = 8

size of tag4 = 9

l_tag2 = 0xbffffad0,&l_tag2.c = 0xbffffad8,l_tag2.c = (nil)

l_tag3 = 0xbffffac8,l_tag3.c = 0xbffffad0

l_tag4 = 0xbffffabc,l_tag4.c = 0xbffffac4

 

從上面程序和運行結果可以看出:tag1本身包括兩個位整數,所以占了8個字節的空間。tag2包括了兩個位的整數,外加一個char *的指針,所以占了12個字節。tag3才是真正看出char c[0]和char *c的區別,char c[0]中的c並不是指針,是一個偏移量,這個偏移量指向的是a、b后面緊接着的空間,所以它其實並不占用任何空間。tag4更加補充說明了這一點。所以,上面的struct pppoe_tag的最后一個成員如果用char *tag_data定義,除了會占用多個字節的指針變量外,用起來會比較不方便:方法一,創建時,可以首先為struct pppoe_tag分配一塊內存,再為tag_data分配內存,這樣在釋放時,要首先釋放tag_data占用的內存,再釋放pppoe_tag占用的內存;方法二,創建時,直接為struct pppoe_tag分配一塊struct pppoe_tag大小加上tag_data的內存,從例一的行可以看出,tag_data的內容要進行初始化,要讓tag_data指向strct pppoe_tag后面的內存。

struct pppoe_tag {

    __u16 tag_type;

    __u16 tag_len;

    char *tag_data;

} __attribute ((packed));

 

struct pppoe_tag *sample_tag;

__u16 sample_tag_len = 10;

方法一:

sample_tag = (struct pppoe_tag *)malloc(sizeof(struct pppoe_tag));

sample_tag->tag_len = sample_tag_len;

sample_tag->tag_data = malloc(sizeof(char)*sample_tag_len);

sample_tag->tag_data[0]=...

釋放時:

free(sample_tag->tag_data);

free(sample_tag);

 

方法二:

sample_tag = (struct pppoe_tag *)malloc(sizeof(struct pppoe_tag)+sizeof(char)*sample_tag_len);

sample_tag->tag_len = sample_tag_len;

sample_tag->tag_data = ((char *)sample_tag)+sizeof(struct pppoe_tag);

sample_tag->tag_data[0]=...

釋放時:

free(sample_tag);

所以無論使用那種方法,都沒有char tag_data[0]這樣的定義來得方便。

 

講了這么多,其實本質上涉及到的是一個C語言里面的數組和指針的區別問題。char a[1]里面的a和char *b的b相同嗎?《Programming Abstractions in C》(Roberts, E.S.,機械工業出版社,.6)頁里面說:“arr is defined to be identical to &arr[0]”。也就是說,char a[1]里面的a實際是一個常量,等於&a[0]。而char *b是有一個實實在在的指針變量b存在。所以,a=b是不允許的,而b=a是允許的。兩種變量都支持下標式的訪問,那么對於a[0]和b[0]本質上是否有區別?我們可以通過一個例子來說明。

 

例二:

10  #include <stdio.h>

20  #include <stdlib.h>

30

40  int main()

50  {

60      char a[10];

70      char *b;

80

90      a[2]=0xfe;

100     b[2]=0xfe;

110     exit(0);

120  }

 

編譯后,用objdump可以看到它的匯編:

080483f0 <main>:

80483f0:       55                      push   %ebp

80483f1:       89 e5                   mov    %esp,%ebp

80483f3:       83 ec 18                sub    $0x18,%esp

80483f6:       c6 45 f6 fe             movb   $0xfe,0xfffffff6(%ebp)

80483fa:       8b 45 f0                mov    0xfffffff0(%ebp),%eax

80483fd:       83 c0 02                add    $0x2,%eax

8048400:       c6 00 fe                movb   $0xfe,(%eax)

8048403:       83 c4 f4                add    $0xfffffff4,%esp

8048406:       6a 00                   push   $0x0

8048408:       e8 f3 fe ff ff          call   8048300 <_init+0x68>

804840d:       83 c4 10                add    $0x10,%esp

8048410:       c9                      leave

8048411:       c3                      ret

8048412:       8d b4 26 00 00 00 00    lea    0x0(%esi,1),%esi

8048419:       8d bc 27 00 00 00 00    lea    0x0(%edi,1),%edi

 

可以看出,a[2]=xfe是直接尋址,直接將xfe寫入&a[0]+2的地址,而b[2]=0xfe是間接尋址,先將b的內容(地址)拿出來,加,再xfe寫入計算出來的地址。所以a[0]和b[0]本質上是不同的。但當數組作為參數時,和指針就沒有區別了。

int do1(char a[],int len);

int do2(char *a,int len);

這兩個函數中的a並無任何區別。都是實實在在存在的指針變量。

 

順便再說一下,對於struct pppoe_tag的最后一個成員的定義是char tag_data[0],某些編譯器不支持長度為0的數組的定義,在這種情況下,只能將它定義成char tag_data[1],使用方法相同。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM