Linux性能分析工具與圖形化方法

本文轉載自查看原文 2018-03-16 18:52 2375

歡迎大家前往騰訊雲+社區，獲取更多騰訊海量技術實踐干貨哦~。

作者：趙坤|騰訊魔王工作室后台開發工程師

在項目開發中，經常會遇到程序啟動時間過長、CPU使用率過高等問題，這個時候需要依靠性能分析工具來定位性能的消耗點。本文介紹三個常用的工具的入門級使用及圖形化方法，供大家參考。

本文介紹Perf、gprof和Valgrind三個性能分析工具，及其分析結果圖形化的方法，旨在讓大家更快的上手使用工具。出於篇幅的限制，本文不會對每種工具的使用參數及結果分析做詳細的介紹，只做入門級的使用說明，更多詳細的說明大家請Google一下。

每個工具的介紹會分成簡介、使用說明、圖形化方法三個部分。

每種工具的結果都會基於下面這段代碼：

#include <unistd.h>using namespace std;#define NUM 500000void init(int* int_array){
for(int i=0;i<NUM;i++){
int_array[i]=i;
}}void accu(int* int_array,long& sum ){
for(int i=0;i<NUM;i++){
sum+=int_array[i];
usleep(3);
}}int main(){
int int_array[NUM];
init(int_array);
long sum=0;
accu(int_array,sum);}

這段代碼在普通PC上執行了31s，最大CPU使用率為8.3%

Perf1.1 簡介

Perf是內置於Linux內核源碼樹中的性能剖析(profiling)工具。其基於事件采樣原理，以性能事件為基礎，常用於性能瓶頸的查找與熱點代碼的定位。

1.2 使用

perf的使用可以分為兩種方式：

直接使用perf啟動服務
掛接到已啟動的進程

第一種方式不需要root權限，第二種方式需要root權限

基於入門級使用這一前提，直接介紹一下使用方式：

perf record -e cpu-clock -g ./run
或者
perf record -e cpu-clock -g -p 4522

使用ctrl+c中斷perf進程，或者在程序執行結束后，會產生perf.data的文件，使用

perf report

會產生結果分析，如圖

1.3 圖形化方法

perf的結果可以生成火焰圖。生成火焰圖需要借助Flame Graph

Flame Graph項目位於GitHub:

https://github.com/brendangregg/FlameGraph

clone代碼或者直接下載壓縮包到服務器上。以壓縮包為例，是一個命名為：FlameGraph-master.zip的文件，假設其解壓后的目錄為：/data

基於1.2產生的perf.data，后續步驟如下：

1、使用perf script工具對perf.data進行解析perf script -i perf.data &> perf.unfold
2、將perf.unfold中的符號進行折疊：/data/stackcollapse-perf.pl perf.unfold &> perf.folded
3、最后生成svg圖：/data/flamegraph.pl perf.folded > perf.svg

生成的火焰圖如下：

關於火焰圖的含義及分析網上有很多文章，這里不再贅述

Gprof2.1 簡介

gprof用於監控程序中每個方法的執行時間和被調用次數，方便找出程序中最耗時的函數。在程序正常退出后，會生成gmon.out文件，解析這個文件，可以生成一個可視化的報告

2.2 使用方法

使用gprof，需要在編譯時，加入-pg選項

另外只有在程序正常退出后才會生成gmon.out，kill進程的方法是沒法生成gmon.out的。對於那些線程會一直run的服務，需要修改代碼，讓程序在某個時間點停止。

重新編譯后，正常啟動程序即可；然后在程序運行結束后，會生成gmon.out文件

使用如下命令，生成報名文件（其中run是二進制的名字）：

gprof -b run gmon.out >>report.txt

report.txt打開如下圖所示：

2.3 圖形化方法

gprof的結果文件需要借助gprof2dot.py和graphviz來展示

使用gprof2dot.py生成dot文件

python gprof2dot.py report.txt >report.dot

需要說明的是，這里要求服務器已經安裝了python，並且要求gprof2dot.py與安裝的python版本匹配。這兩者是否匹配是一個需要運氣、並且解決起來很無聊的事情，我的服務器上安裝的python是2.6.6，第一次從網上下載的gprof2dot-2017.9.19與python版本就不匹配，執行會出錯。目前使用的版本與2.6.6是兼容的，如果需要可以與我聯系。

dot的打開需要graphviz工具，我是在windows下安裝的graphviz，這個工具下載很簡單。下載后使用gvedit.ext打開前一個步驟產生的report.dot文件即可

這個圖顯的有些萌萌噠，這是因為我們的程序寫的比較簡單，對於一般的業務而言，這個圖會比較復雜。

Valgrind3.1 簡介

valgrind不是linux的原生工具，需要自行安裝。valgrind自身包含了多個工具：

Memcheck：用於內存泄漏檢查
Callgrind：用於性能分析，會收集程序運行時間和調用關系
以及Cachegrind、Helgrind等

這里我們主要使用的Callgrind工具

3.2 使用方法

首先需要安裝valgrind：

http://valgrind.org/downloads/valgrind-3.12.0.tar.bz2

解壓安裝包后，順次執行：./configue 、make、make install 就可以了

使用valgrind來分析性能，必須使用valgrind來啟動程序：

valgrind --tool=callgrind --separate-threads=yes ./run

--separate-threads是指是否按線程來分別統計，如果不加，會將所有線程的結果打到一個文件里；否則會按線程分別打印到不同文件里。

程序執行結束后，會生成形如：callgrind.out.4263-01的文件。這個文件直接分析起來有些困難，必須借助圖形化的方式來瀏覽

3.3 圖形化方法

valgrind的圖形化需要借助kcachegrind.exe，大家可以自行下載，下載后在windows運行即可。這是打開callgrind.out.4263-01的結果：

4工具比較

對於我們的需求：定位執行時間最長、占用CPU最多的函數來說，這三個工具都可以達到目的。但這三者之間還是有一定的差距：

4.1 啟動方式

Perf雖然可以掛接進程但需要root權限。在普通權限下，Perf和Valgrind必須使用前綴啟動的方式來啟動程序，這在某種程度上會影響到程序的性能。我們在壓測的過程中發現使用Valgrind啟動的時候，可以支持的在線總人數比直接運行程序要少很多。

4.2 程序侵入

Perf和Valgrind都不需要修改Makefile或者程序，但gprof需要重新編譯文件，並且對於線程一直run的服務，還需要修改代碼讓其自然退出，這在一定程序上侵入了程序。但從對性能影響上來看，gprof可以最大限制的保留原程序的性能

4.3 結果展示

gprof的結果是一顆倒樹，這顆樹展示了從根到葉子的所有結點的時間消耗；perf的是一個金字塔，與gprof有異曲同工之妙；Valgrind的結果是一條單路，指出的是某條調用路徑上的時間消耗，並不是一個全局的展示。

4.4 監控原理

這是一個很專業的話題，目前對三者的監控原理還沒有摸的太透，所以這里暫時空着。大家有興趣可以先行研究。

問答

linux實時調度算法？

Linux中的多線程處理？

相關閱讀

Linux 常用性能工具簡介

常見Linux調優命令和工具

性能優化：Linux環境下合理配置大內存頁

此文已由作者授權騰訊雲+社區發布，轉載請注明文章出處

原文鏈接：https://cloud.tencent.com/developer/article/1063652

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Sparrow-WiFi：一款Linux平台下的圖形化WiFi及藍牙分析工具 linux 用yum安裝圖形化界面 python的圖形化編程方法 XManager遠程Linux 安裝Oracle 圖形化界面xstart解決方法 kvm圖形化管理工具 Elasticsearch安裝圖形化界面工具Head插件 zookeeper圖形化的客戶端工具(ZooInspector) zookeeper系列（一）zookeeper圖形化的客戶端工具 docker圖形化管理工具科學計算：Python 分析數據找問題，並圖形化