linux下利用backtrace追蹤函數調用堆棧以及定位段錯誤


一般察看函數運行時堆棧的方法是使用GDB(bt命令)之類的外部調試器,但是,有些時候為了分析程序的BUG,(主要針對長時間運行程序的分析),在程序出錯時打印出函數的調用堆棧是非常有用的。

在glibc頭文件"execinfo.h"中聲明了三個函數用於獲取當前線程的函數調用堆棧。

 

[cpp]  view plain  copy
 
 print?
  1. int backtrace(void **buffer,int size)  

該函數用於獲取當前線程的調用堆棧,獲取的信息將會被存放在buffer中,它是一個指針列表。參數 size 用來指定buffer中可以保存多少個void* 元素。函數返回值是實際獲取的指針個數,最大不超過size大小

在buffer中的指針實際是從堆棧中獲取的返回地址,每一個堆棧框架有一個返回地址

注意:某些編譯器的優化選項對獲取正確的調用堆棧有干擾,另外內聯函數沒有堆棧框架;刪除框架指針也會導致無法正確解析堆棧內容

 

[cpp]  view plain  copy
 
 print?
  1. char ** backtrace_symbols (void *const *buffer, int size)  

backtrace_symbols將從backtrace函數獲取的信息轉化為一個字符串數組. 參數buffer應該是從backtrace函數獲取的指針數組,size是該數組中的元素個數(backtrace的返回值)   
   
函數返回值是一個指向字符串數組的指針,它的大小同buffer相同.每個字符串包含了一個相對於buffer中對應元素的可打印信息.它包括函數名,函數的偏移地址,和實際的返回地址

現在,只有使用ELF二進制格式的程序才能獲取函數名稱和偏移地址.在其他系統,只有16進制的返回地址能被獲取.另外,你可能需要傳遞相應的符號給鏈接器,以能支持函數名功能(比如,在使用GNU ld鏈接器的系統中,你需要傳遞(-rdynamic), -rdynamic可用來通知鏈接器將所有符號添加到動態符號表中,如果你的鏈接器支持-rdynamic的話,建議將其加上!)

該函數的返回值是通過malloc函數申請的空間,因此調用者必須使用free函數來釋放指針.

注意:如果不能為字符串獲取足夠的空間函數的返回值將會為NULL

 

[cpp]  view plain  copy
 
 print?
  1. void backtrace_symbols_fd (void *const *buffer, int size, int fd)  

backtrace_symbols_fd與backtrace_symbols 函數具有相同的功能,不同的是它不會給調用者返回字符串數組,而是將結果寫入文件描述符為fd的文件中,每個函數對應一行.它不需要調用malloc函數,因此適用於有可能調用該函數會失敗的情況

 

下面是glibc中的實例(稍有修改):

[cpp]  view plain  copy
 
 print?
  1. #include <execinfo.h>  
  2. #include <stdio.h>  
  3. #include <stdlib.h>  
  4.   
  5. /* Obtain a backtrace and print it to @code{stdout}. */  
  6. void print_trace (void)  
  7. {  
  8.     void *array[10];  
  9.     size_t size;  
  10.     char **strings;  
  11.     size_t i;  
  12.    
  13.     size = backtrace (array, 10);  
  14.     strings = backtrace_symbols (array, size);  
  15.     if (NULL == strings)  
  16.     {  
  17.         perror("backtrace_synbols");  
  18.         Exit(EXIT_FAILURE);  
  19.     }  
  20.   
  21.     printf ("Obtained %zd stack frames.\n", size);  
  22.   
  23.     for (i = 0; i < size; i++)  
  24.         printf ("%s\n", strings[i]);  
  25.   
  26.     free (strings);  
  27.     strings = NULL;  
  28. }  
  29.   
  30. /* A dummy function to make the backtrace more interesting. */  
  31. void dummy_function (void)  
  32. {  
  33.     print_trace ();  
  34. }  
  35.   
  36. int main (int argc, char *argv[])  
  37. {  
  38.     dummy_function ();  
  39.     return 0;  
  40. }  

輸出如下:

[cpp]  view plain  copy
 
 print?
  1. Obtained 4 stack frames.  
  2. ./execinfo() [0x80484dd]  
  3. ./execinfo() [0x8048549]  
  4. ./execinfo() [0x8048556]  
  5. /lib/i386-linux-gnu/libc.so.6(__libc_start_main+0xf3) [0x70a113]  


 

我們還可以利用這backtrace來定位段錯誤位置。

通常情況系,程序發生段錯誤時系統會發送SIGSEGV信號給程序,缺省處理是退出函數。我們可以使用 signal(SIGSEGV, &your_function);函數來接管SIGSEGV信號的處理,程序在發生段錯誤后,自動調用我們准備好的函數,從而在那個函數里來獲取當前函數調用棧。

舉例如下:

[cpp]  view plain  copy
 
 print?
  1. #include <stdio.h>  
  2. #include <stdlib.h>  
  3. #include <stddef.h>  
  4. #include <execinfo.h>  
  5. #include <signal.h>  
  6.   
  7. void dump(int signo)  
  8. {  
  9.     void *buffer[30] = {0};  
  10.     size_t size;  
  11.     char **strings = NULL;  
  12.     size_t i = 0;  
  13.   
  14.     size = backtrace(buffer, 30);  
  15.     fprintf(stdout, "Obtained %zd stack frames.nm\n", size);  
  16.     strings = backtrace_symbols(buffer, size);  
  17.     if (strings == NULL)  
  18.     {  
  19.         perror("backtrace_symbols.");  
  20.         exit(EXIT_FAILURE);  
  21.     }  
  22.       
  23.     for (i = 0; i < size; i++)  
  24.     {  
  25.         fprintf(stdout, "%s\n", strings[i]);  
  26.     }  
  27.     free(strings);  
  28.     strings = NULL;  
  29.     exit(0);  
  30. }  
  31.   
  32. void func_c()  
  33. {  
  34.     *((volatile char *)0x0) = 0x9999;  
  35. }  
  36.   
  37. void func_b()  
  38. {  
  39.     func_c();  
  40. }  
  41.   
  42. void func_a()  
  43. {  
  44.     func_b();  
  45. }  
  46.   
  47. int main(int argc, const char *argv[])  
  48. {  
  49.     if (signal(SIGSEGV, dump) == SIG_ERR)  
  50.         perror("can't catch SIGSEGV");  
  51.     func_a();  
  52.     return 0;  
  53. }  


 

編譯程序:

gcc -g -rdynamic test.c -o test; ./test

輸出如下:

[cpp]  view plain  copy
 
 print?
  1. Obtained6stackframes.nm  
  2. ./backstrace_debug(dump+0x45)[0x80487c9]  
  3. [0x468400]  
  4. ./backstrace_debug(func_b+0x8)[0x804888c]  
  5. ./backstrace_debug(func_a+0x8)[0x8048896]  
  6. ./backstrace_debug(main+0x33)[0x80488cb]  
  7. /lib/i386-linux-gnu/libc.so.6(__libc_start_main+0xf3)[0x129113]  

 (這里有個疑問: 多次運行的結果是/lib/i368-linux-gnu/libc.so.6和[0x468400]的返回地址是變化的,但不變的是后三位, 不知道為什么)

接着:

objdump -d test > test.s

在test.s中搜索804888c如下:

 

[cpp]  view plain  copy
 
 print?
  1. 8048884 <func_b>:  
  2. 8048884:    55              push %ebp  
  3. 8048885:    89 e5            mov %esp, %ebp  
  4. 8048887:    e8 eb ff ff ff       call 8048877 <func_c>  
  5. 804888c:    5d                pop %ebp  
  6. 804888d:    c3                ret  

其中80488c時調用(call 8048877)C函數后的地址,雖然並沒有直接定位到C函數,通過匯編代碼, 基本可以推出是C函數出問題了(pop指令不會導致段錯誤的)。

我們也可以通過addr2line來查看

[cpp]  view plain  copy
 
 print?
  1. addr2line 0x804888c -e backstrace_debug -f  

輸出:

[cpp]  view plain  copy
 
 print?
  1. func_b  
  2. /home/astrol/c/backstrace_debug.c:57  


 

以下是簡單的backtrace原理實現:

 

[cpp]  view plain  copy
 
 print?
  1. #include <stdio.h>  
  2. #include <stdlib.h>  
  3. #include <string.h>  
  4.   
  5. #define LEN 4  
  6. #define FILENAME "stack"  
  7.   
  8. int backtrace(void **buffer, int size)  
  9. {  
  10.     int i = 0;  
  11.     unsigned long int reg_eip = 0;  
  12.     unsigned long int reg_ebp = 0;  
  13.     char cmd[size][64];  
  14.   
  15.     memset(cmd, 0, size * 64);  
  16.     __asm__ volatile (  
  17.         /* get current EBP */  
  18.         "movl %%ebp, %0 \n\t"  
  19.         :"=r"(reg_ebp)  /* output register */  
  20.         :       /* input  register */  
  21.         :"memory"   /* cloberred register */  
  22.     );    
  23.   
  24.     for (i = 0; i < size; i++)  
  25.     {  
  26.         reg_eip = *(unsigned long int *)(reg_ebp + 4);  
  27.         reg_ebp = *(unsigned long int *)(reg_ebp);  
  28.         buffer[i] = (void *)reg_eip;  
  29.         fprintf(stderr, "%p -> ", buffer[i]);  
  30.         sprintf(cmd[i], "addr2line %p -e ", buffer[i]);  
  31.         strncat(cmd[i], FILENAME" -f", strlen(FILENAME)+3);  
  32.         system(cmd[i]);  
  33.         puts("");         
  34.     }  
  35.   
  36.     return size;  
  37. }  
  38.   
  39. static void test2(void)  
  40. {  
  41.     int i = 0;  
  42.     void *buffer[LEN] = {0};  
  43.     backtrace(buffer, LEN);  
  44.     return;  
  45. }  
  46.   
  47. static void test1(void)  
  48. {  
  49.     test2();  
  50. }  
  51.   
  52. static void test(void)  
  53. {  
  54.     test1();  
  55. }  
  56.   
  57. int main(int argc, const char *argv[])  
  58. {  
  59.     test();  
  60.     return 0;  
  61. }  



 

參考鏈接:http://blog.csdn.net/qqwx_1986/article/details/5942863


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM