平均負載
實時監控平均負載,高亮顯示變化的區域
watch -d uptime
CPU指標篇
CPU個數
grep 'model name' /proc/cpuinfo | wc -l
Sysstat
Sysstat是一種在Linux系統服務器中常用的軟件工具包,可以用來監控服務器的性能。比如可以監控CPU、硬盤、網絡等數據,我們可以用來進行分析服務器的性能和資源的使用效率。
Linux下,我們多用ssh鏈接服務器遠程操控。對於系統的監控必不可少,sysstat很不錯的監控工具包。
- iostat: 輸出CPU的統計信息和所有I/O設備的輸入輸出(I/O)統計信息。
- mpstat: 關於CPU的詳細信息(單獨輸出或者分組輸出)。
- pidstat: 關於運行中的進程/任務、CPU、內存等的統計信息。
- sar: 保存並輸出不同系統資源(CPU、內存、IO、網絡、內核等。。。)的詳細信息。
- sadc: 系統活動數據收集器,用於收集sar工具的后端數據。
- sa1: 系統收集並存儲sadc數據文件的二進制數據,與sadc工具配合使用
- sa2: 配合sar工具使用,產生每日的摘要報告。
- sadf: 用於以不同的數據格式(CVS或者XML)來格式化sar工具的輸出。
- Sysstat: sysstat工具的man幫助頁面。
- nfsiostat: NFS(Network File System)的I/O統計信息。
- cifsiostat: CIFS(Common Internet File System)的統計信息。
前期准備
Git安裝方式
mkdir /usr/local/sysstat yum install -y git git clone git://github.com/sysstat/sysstat cd sysstat ./configure --prefix=/usr/local/sysstat make &&make install
配置環境變量
1.vi /etc/profile
#sysstat
export PATH=/usr/local/sysstat/bin:$PATH
2.source /etc/profile
3.sar -V
sysstat version 12.5.1 (C) Sebastien Godard (sysstat <at> orange.fr)
這里主要介紹mpstat與pidstat工具
mpstat
mpstat 用於多處理器系統中的CPU的利用率的統計。細化到具體某個cpu的狀態時可以使用參數-P,處理器的ID從0開始。
mpstat --help
選項:
mpstat [-P {cpu|ALL}] [internal [count]]
- -P {cpu l ALL} 表示監控哪個CPU, cpu在[0,cpu個數-1]中取值
- internal 相鄰的兩次采樣的間隔時間
- count 采樣的次數,count只能和delay一起使用
使用方式
mpstat -P ALL 3:每隔三秒打印所有cpu的數據,一直打印。 mpstat -P 0 5:每隔五秒打印cpu0的數據,一直打印。 mpstat -P ALL 2 5:每隔兩秒打印所有cpu的數據,打印5組。
輸出說明
%user 顯示在用戶級別(application)運行使用 CPU 總時間的百分比。 %nice 顯示在用戶級別,用於nice操作,所占用 CPU 總時間的百分比。 %system 在核心級別(kernel)運行所使用 CPU 總時間的百分比。 %iowait 顯示用於等待I/O操作占用 CPU 總時間的百分比。 %irq 顯示在interval時間段內,硬中斷占用的CPU總時間。 %soft 顯示在interval時間段內,軟中斷占用的CPU總時間。 %steal 管理程序(hypervisor)為另一個虛擬進程提供服務而等待虛擬CPU的百分比。 %guest 顯示運行虛擬處理器時CPU花費時間的百分比 %gnice %idle 顯示 CPU 空閑時間占用CPU總時間的百分比。
pidstat
pidstat 的用法:
pidstat [ 選項 ] [ <時間間隔> ] [ <次數> ]
如下圖:

常用的參數:
- -u:默認的參數,顯示各個進程的cpu使用統計
- -r:顯示各個進程的內存使用統計
- -d:顯示各個進程的IO使用情況
- -p:指定進程號
- -w:顯示每個進程的上下文切換情況
- -t:顯示選擇任務的線程的統計信息外的額外信息
- -T { TASK | CHILD | ALL }
這個選項指定了pidstat監控的。TASK表示報告獨立的task,CHILD關鍵字表示報告進程下所有線程統計信息。ALL表示報告獨立的task和task下面的所有線程。
注意:task和子線程的全局的統計信息和pidstat選項無關。這些統計信息不會對應到當前的統計間隔,這些統計信息只有在子線程kill或者完成的時候才會被收集。 - -V:版本號
- -h:在一行上顯示了所有活動,這樣其他程序可以容易解析。
- -I:在SMP環境,表示任務的CPU使用率/內核數量
- -l:顯示命令名和所有參數
示例一:查看所有進程的 CPU 使用情況( -u -p ALL)
pidstat
pidstat -u -p ALL
pidstat 和 pidstat -u -p ALL 是等效的。
pidstat 默認顯示了所有進程的cpu使用率。

詳細說明
- PID:進程ID
- %usr:進程在用戶空間占用cpu的百分比
- %system:進程在內核空間占用cpu的百分比
- %guest:進程在虛擬機占用cpu的百分比
- %CPU:進程占用cpu的百分比
- CPU:處理進程的cpu編號
- Command:當前進程對應的命令
示例二: cpu使用情況統計(-u)
pidstat -u
使用-u選項,pidstat將顯示各活動進程的cpu使用統計,執行”pidstat -u”與單獨執行”pidstat”的效果一樣。
pidstat -u 5:間隔五秒輸出一組cpu指標,一直輸出
pidstat -u 5 5:間隔五秒輸出一組cpu指標,輸出5組
示例三: 內存使用情況統計(-r)
pidstat -r
pidstat -r 5:間隔五秒輸出一組內存指標,一直輸出 pidstat -r 5 5:間隔五秒輸出一組內存指標,輸出5組
使用-r選項,pidstat將顯示各活動進程的內存使用統計:

- PID:進程標識符
- Minflt/s:任務每秒發生的次要錯誤,不需要從磁盤中加載頁
- Majflt/s:任務每秒發生的主要錯誤,需要從磁盤中加載頁
- VSZ:虛擬地址大小,虛擬內存的使用KB
- RSS:常駐集合大小,非交換區五里內存使用KB
- Command:task命令名
示例四:顯示各個進程的IO使用情況(-d)
pidstat -d

報告IO統計顯示以下信息:
- PID:進程id
- kB_rd/s:每秒從磁盤讀取的KB
- kB_wr/s:每秒寫入磁盤KB
- kB_ccwr/s:任務取消的寫入磁盤的KB。當任務截斷臟的pagecache的時候會發生。
- COMMAND:task的命令名
示例五:顯示每個進程的上下文切換情況(-w)
pidstat -w -p 2831

- PID:進程id
- Cswch/s:每秒主動任務上下文切換數量
- Nvcswch/s:每秒被動任務上下文切換數量
- Command:命令名
自願上下文切換,是指進程無法獲取所需資源,導致的上下文切換。比如說, I/O、內存等系統資源不足時,就會發生自願上下文切換。
非自願上下文切換,則是指進程由於時間片已到等原因,被系統強制調度,進而發生的上下文切換。比如說,大量進程都在爭搶 CPU 時,就容易發生非自願上下文切換。
上下文切換和中斷篇
vmstat
一個常用的系統性能分析工具,主要用來分析系統的內存使用情況,也常用來分析 CPU 上下文切換和中斷的次數。
示例:vmstat 5 #每隔5秒輸出1組數據
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
0 0 0 7005360 91564 818900 0 0 0 0 25 33 0 0 100 0 0
cs(context switch)是每秒上下文切換的次數。
in(interrupt)則是系統每秒中斷的次數。
r(Running or Runnable)是就緒隊列的長度,也就是正在運行和等待 CPU 的進程數。
b(Blocked)則是處於不可中斷睡眠狀態的進程數。
注意:
1、vmstat 只給出了系統總體的上下文切換情況,如果你想查看進程的上下切換次數可以使用:
pidstat -w 5
2、在實際中,我們經常需要查看進程的cpu指標和上下切換次數指標,可以使用:
pidstat -w -u 1
cat /proc/interrupts
當使用vmstat發現系統中斷次數(in)過高時,可以使用(查看具體中斷類型和相關中斷次數):
watch -d cat /proc/interrupts
- 自願上下文切換變多了,說明進程都在等待資源,有可能發生了 I/O 等其他問題;
- 非自願上下文切換變多了,說明進程都在被強制調度,也就是都在爭搶 CPU,說明 CPU 的確成了瓶頸;
- 中斷次數變多了,說明 CPU 被中斷處理程序占用,還需要通過查看 /proc/interrupts 文件來分析具體的中斷類型。
調度優先級和調度類
nice命令
nice命令可以調整進程的優先級,正nice值調低優先級,而負值調高優先級,能獲得更多的cpu資源,后者只能由超級用戶設置,范圍-20~+19。
nice
命令格式:nice [OPTION] [COMMAND [ARG]...]
當nice沒有選項時,輸出值表示系統進程缺省的niceness值,一般為0。
nice
0
當nice
命令中沒有給出具體的niceness值時,默認為10。如nice vi
設置vi進程的niceness為10。
-n
選項后面跟具體的niceness值。niceness值的范圍-20~19,小於-20或大於19的值分別記為-20和19。
nice -n 10 vi&
該命令設置vi進程的niceness值為10,也就是較低的優先級。
ps -l
查看進程的niceness值。
renice命令
以上討論的都是為即將運行的進程設置niceness值,而renice
用於改變正在運行的進程的niceness值。
renice
,字面意思即重新設置niceness值,進程啟動時默認的niceness值為0,可以用renice更新。
renice
語法:renice
[優先等級][
-g<程序群組名稱>...][
-p<程序識別碼>...][-u <用戶名稱>...]
renice -5 -p 5200 #將PID為5200的進程的niceness設為-5 renice -5 -u xie #將屬於用戶xie的進程的niceness設為-5 renice -5 -g group1 #將屬於group1組的程序的niceness設為5
進程綁定
cat /proc/cpuinfo | grep process
taskset -pc 7-10 10790
taskset -pc 7,10 10790