轉載需注明來源:http://www.cnblogs.com/yczcc/p/7595099.html
發現了一個字符數組初始化的誤區,而這個往往能導致比較嚴重的性能問題,分析介紹如下:
往往我們在初始化一個字符 數組,大概有如下幾種寫法:
1 char array1[1024] = ""; 2 char array2[1024] = {0}; 3 char array3[1024] = {'\0'}; 4 char array4[1024]; 5 array4[0] = '\0';
但這四種寫法,其實代表含義不同,看起來前三種寫法只是將array的第一個字符置為0,其實前三種在gcc編譯時,都是調用了memset來將整個array置為0,如果這個array很長,其實也會導致性能問題。我寫了一個簡單的小程序編譯生成test,objdump了一 下,執行“objdump -S test”可以看下面的代碼:
1 int main() { 2 400698: 55 push %rbp 3 400699: 48 89 e5 mov %rsp,%rbp 4 40069c: 48 81 ec 00 10 00 00 sub $0x1000,%rsp 5 char array1[1024] = ""; 6 4006a3: 0f b6 05 42 01 00 00 movzbl 322(%rip),%eax # 4007ec <_IO_stdin_used+0x4> 7 4006aa: 88 85 00 fc ff ff mov %al,0xfffffffffffffc00(%rbp) 8 4006b0: 48 8d bd 01 fc ff ff lea 0xfffffffffffffc01(%rbp),%rdi 9 4006b7: ba ff 03 00 00 mov $0x3ff,%edx 10 4006bc: be 00 00 00 00 mov $0x0,%esi 11 4006c1: e8 fa fe ff ff callq 4005c0 <memset@plt> //調用了memset 12 13 char array2[1024] = {0}; 14 4006c6: 48 8d bd 00 f8 ff ff lea 0xfffffffffffff800(%rbp),%rdi 15 4006cd: ba 00 04 00 00 mov $0x400,%edx 16 4006d2: be 00 00 00 00 mov $0x0,%esi 17 4006d7: e8 e4 fe ff ff callq 4005c0 <memset@plt> //調用了memset 18 19 char array3[1024] = {'\0'}; 20 4006dc: 48 8d bd 00 f4 ff ff lea 0xfffffffffffff400(%rbp),%rdi 21 4006e3: ba 00 04 00 00 mov $0x400,%edx 22 4006e8: be 00 00 00 00 mov $0x0,%esi 23 4006ed: e8 ce fe ff ff callq 4005c0 <memset@plt> //調用了memset 24 25 char array4[1024]; 26 array4[0] = '\0'; 27 4006f2: c6 85 00 f0 ff ff 00 movb $0x0,0xfffffffffffff000(%rbp) 28 29 return 0; 30 4006f9: b8 00 00 00 00 mov $0x0,%eax 31 }
所以,對這四種寫法,實際執行的代碼解釋如下:
char array1[1024] = ""; //第11行,調用memset將1023個字符置為0
char array2[1024] = {0}; //第17行,調用memset將1024個字符置為0
char array3[1024] = {'\0'}; //第23行,調用memset將1024個字符置為0
char array4[1024];
array4[0] = '\0'; //只是將第一個字符置為0
而對於字符數組,往往只是作為一個字符串的臨時緩沖區使用,沒有必要將整個數組置為0,所以第四種寫法往往就能達到初始化的目的。建議使用第四種寫法來初始化一個字符數組,這樣能節約很多性能消耗。
