Linux 性能調優CPU篇:工具命令篇


 

 平均負載

實時監控平均負載,高亮顯示變化的區域

watch -d uptime

CPU指標篇

CPU個數

grep 'model name' /proc/cpuinfo | wc -l

 

Sysstat

Sysstat是一種在Linux系統服務器中常用的軟件工具包,可以用來監控服務器的性能。比如可以監控CPU、硬盤、網絡等數據,我們可以用來進行分析服務器的性能和資源的使用效率。

Linux下,我們多用ssh鏈接服務器遠程操控。對於系統的監控必不可少,sysstat很不錯的監控工具包。

  • iostat: 輸出CPU的統計信息和所有I/O設備的輸入輸出(I/O)統計信息。
  • mpstat: 關於CPU的詳細信息(單獨輸出或者分組輸出)。
  • pidstat: 關於運行中的進程/任務、CPU、內存等的統計信息。
  • sar: 保存並輸出不同系統資源(CPU、內存、IO、網絡、內核等。。。)的詳細信息。
  • sadc: 系統活動數據收集器,用於收集sar工具的后端數據。
  • sa1: 系統收集並存儲sadc數據文件的二進制數據,與sadc工具配合使用
  • sa2: 配合sar工具使用,產生每日的摘要報告。
  • sadf: 用於以不同的數據格式(CVS或者XML)來格式化sar工具的輸出。
  • Sysstat: sysstat工具的man幫助頁面。
  • nfsiostat: NFS(Network File System)的I/O統計信息。
  • cifsiostat: CIFS(Common Internet File System)的統計信息。

前期准備

Git安裝方式

mkdir /usr/local/sysstat
yum install -y git
git clone git://github.com/sysstat/sysstat
cd sysstat
./configure --prefix=/usr/local/sysstat
make &&make install

配置環境變量

1.vi /etc/profile

#sysstat
export PATH=/usr/local/sysstat/bin:$PATH

2.source  /etc/profile

3.sar -V

sysstat version 12.5.1
(C) Sebastien Godard (sysstat <at> orange.fr)

這里主要介紹mpstat與pidstat工具

mpstat

mpstat 用於多處理器系統中的CPU的利用率的統計。細化到具體某個cpu的狀態時可以使用參數-P,處理器的ID從0開始。
mpstat --help
選項:

mpstat [-P {cpu|ALL}] [internal [count]]
  • -P {cpu l ALL} 表示監控哪個CPU, cpu在[0,cpu個數-1]中取值
  • internal 相鄰的兩次采樣的間隔時間
  • count 采樣的次數,count只能和delay一起使用

使用方式

mpstat -P ALL 3:每隔三秒打印所有cpu的數據,一直打印。
mpstat -P 0 5:每隔五秒打印cpu0的數據,一直打印。
mpstat -P ALL 2 5:每隔兩秒打印所有cpu的數據,打印5組。

輸出說明

%user 顯示在用戶級別(application)運行使用 CPU 總時間的百分比。 
%nice 顯示在用戶級別,用於nice操作,所占用 CPU 總時間的百分比。
%system 在核心級別(kernel)運行所使用 CPU 總時間的百分比。  
%iowait 顯示用於等待I/O操作占用 CPU 總時間的百分比。
%irq 顯示在interval時間段內,硬中斷占用的CPU總時間。
%soft 顯示在interval時間段內,軟中斷占用的CPU總時間。
%steal 管理程序(hypervisor)為另一個虛擬進程提供服務而等待虛擬CPU的百分比。
%guest  顯示運行虛擬處理器時CPU花費時間的百分比   
%gnice      
%idle 顯示 CPU 空閑時間占用CPU總時間的百分比。

pidstat 

pidstat 的用法:

pidstat [ 選項 ] [ <時間間隔> ] [ <次數> ]

如下圖:

常用的參數:

  • -u:默認的參數,顯示各個進程的cpu使用統計
  • -r:顯示各個進程的內存使用統計
  • -d:顯示各個進程的IO使用情況
  • -p:指定進程號
  • -w:顯示每個進程的上下文切換情況
  • -t:顯示選擇任務的線程的統計信息外的額外信息
  • -T { TASK | CHILD | ALL }
    這個選項指定了pidstat監控的。TASK表示報告獨立的task,CHILD關鍵字表示報告進程下所有線程統計信息。ALL表示報告獨立的task和task下面的所有線程。
    注意:task和子線程的全局的統計信息和pidstat選項無關。這些統計信息不會對應到當前的統計間隔,這些統計信息只有在子線程kill或者完成的時候才會被收集。
  • -V:版本號
  • -h:在一行上顯示了所有活動,這樣其他程序可以容易解析。
  • -I:在SMP環境,表示任務的CPU使用率/內核數量
  • -l:顯示命令名和所有參數

示例一:查看所有進程的 CPU 使用情況( -u -p ALL)

pidstat
pidstat -u -p ALL

pidstat 和 pidstat -u -p ALL 是等效的。
pidstat 默認顯示了所有進程的cpu使用率。

詳細說明

  • PID:進程ID
  • %usr:進程在用戶空間占用cpu的百分比
  • %system:進程在內核空間占用cpu的百分比
  • %guest:進程在虛擬機占用cpu的百分比
  • %CPU:進程占用cpu的百分比
  • CPU:處理進程的cpu編號
  • Command:當前進程對應的命令

示例二: cpu使用情況統計(-u)

pidstat -u

使用-u選項,pidstat將顯示各活動進程的cpu使用統計,執行”pidstat -u”與單獨執行”pidstat”的效果一樣。

pidstat -u 5:間隔五秒輸出一組cpu指標,一直輸出
pidstat -u 5 5:間隔五秒輸出一組cpu指標,輸出5組

示例三: 內存使用情況統計(-r)

pidstat -r
pidstat -r 5:間隔五秒輸出一組內存指標,一直輸出
pidstat -r 5 5:間隔五秒輸出一組內存指標,輸出5組

使用-r選項,pidstat將顯示各活動進程的內存使用統計:

  • PID:進程標識符
  • Minflt/s:任務每秒發生的次要錯誤,不需要從磁盤中加載頁
  • Majflt/s:任務每秒發生的主要錯誤,需要從磁盤中加載頁
  • VSZ:虛擬地址大小,虛擬內存的使用KB
  • RSS:常駐集合大小,非交換區五里內存使用KB
  • Command:task命令名

示例四:顯示各個進程的IO使用情況(-d)

pidstat -d

報告IO統計顯示以下信息:

  • PID:進程id
  • kB_rd/s:每秒從磁盤讀取的KB
  • kB_wr/s:每秒寫入磁盤KB
  • kB_ccwr/s:任務取消的寫入磁盤的KB。當任務截斷臟的pagecache的時候會發生。
  • COMMAND:task的命令名

示例五:顯示每個進程的上下文切換情況(-w)

pidstat -w -p 2831
 
  • PID:進程id
  • Cswch/s:每秒主動任務上下文切換數量
  • Nvcswch/s:每秒被動任務上下文切換數量
  • Command:命令名
自願上下文切換,是指進程無法獲取所需資源,導致的上下文切換。比如說, I/O、內存等系統資源不足時,就會發生自願上下文切換。
非自願上下文切換,則是指進程由於時間片已到等原因,被系統強制調度,進而發生的上下文切換。比如說,大量進程都在爭搶 CPU 時,就容易發生非自願上下文切換。

 

上下文切換和中斷篇

vmstat

一個常用的系統性能分析工具,主要用來分析系統的內存使用情況,也常用來分析 CPU 上下文切換和中斷的次數。

示例:vmstat 5             #每隔5秒輸出1組數據
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu----- 
r b swpd free buff cache si so bi bo in cs us sy id wa st
0 0 0 7005360 91564 818900 0 0 0 0 25 33 0 0 100 0 0

cs(context switch)是每秒上下文切換的次數。

in(interrupt)則是系統每秒中斷的次數。

r(Running or Runnable)是就緒隊列的長度,也就是正在運行和等待 CPU 的進程數。

b(Blocked)則是處於不可中斷睡眠狀態的進程數。

注意:

1、vmstat 只給出了系統總體的上下文切換情況,如果你想查看進程的上下切換次數可以使用:

pidstat -w 5

2、在實際中,我們經常需要查看進程的cpu指標和上下切換次數指標,可以使用:

pidstat -w -u 1

cat /proc/interrupts

當使用vmstat發現系統中斷次數(in)過高時,可以使用(查看具體中斷類型和相關中斷次數):

watch -d cat /proc/interrupts
  • 自願上下文切換變多了,說明進程都在等待資源,有可能發生了 I/O 等其他問題;
  • 非自願上下文切換變多了,說明進程都在被強制調度,也就是都在爭搶 CPU,說明 CPU 的確成了瓶頸;
  • 中斷次數變多了,說明 CPU 被中斷處理程序占用,還需要通過查看 /proc/interrupts 文件來分析具體的中斷類型。

 

調度優先級和調度類

nice命令

nice命令可以調整進程的優先級,正nice值調低優先級,而負值調高優先級,能獲得更多的cpu資源,后者只能由超級用戶設置,范圍-20~+19。

nice命令格式:nice [OPTION] [COMMAND [ARG]...]

當nice沒有選項時,輸出值表示系統進程缺省的niceness值,一般為0。

nice
0

nice命令中沒有給出具體的niceness值時,默認為10。如nice vi設置vi進程的niceness為10。

-n選項后面跟具體的niceness值。niceness值的范圍-20~19,小於-20或大於19的值分別記為-20和19。

nice -n 10 vi&

該命令設置vi進程的niceness值為10,也就是較低的優先級。

可以通過 ps -l查看進程的niceness值。

renice命令

以上討論的都是為即將運行的進程設置niceness值,而renice用於改變正在運行的進程的niceness值。

renice,字面意思即重新設置niceness值,進程啟動時默認的niceness值為0,可以用renice更新。

renice語法:renice [優先等級][-g<程序群組名稱>...][-p<程序識別碼>...][-u <用戶名稱>...]

renice -5 -p 5200  #將PID為5200的進程的niceness設為-5
renice -5 -u xie   #將屬於用戶xie的進程的niceness設為-5
renice -5 -g group1 #將屬於group1組的程序的niceness設為5

 

進程綁定

一個進程可以綁定在一個或者多個CPU上,這樣可以通過提高緩存命中率和內存本地性來提高性能。
taskset命令可以給進程分配CPU。
查看cpu個數
cat /proc/cpuinfo | grep process
設置PID為10790的進程只能跑在CPU7到CPU10之間。
taskset -pc 7-10 10790
設置PID為10790的進程只能跑在CPU7、CPU10上。
taskset -pc 7,10 10790

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM