nmon結果說明及分析
使用nmon analyser生成的結果文件包含了N多個sheet頁,下面只是結合個人經驗對幾個主要的頁面圖標進行一些分析介紹:
一、整體信息頁面SYS_SUMM
1.折線圖中藍線為cpu占有率變化情況;粉線為磁盤IO的變化情況;
2.下面表各種左邊的位磁盤的總體數據,包括如下幾個:
- Avg tps during an interval:每個間隔時間內,平均每秒IO數,也可以理解為提交處理的次數
- Max tps during an interval:每個間隔時間內,每秒最大IO次數;
- Max tps interval time:最大傳送次數出現的時間點;
- Total number of Mbytes read:整個監控時間內讀的字節數;
- Total number of Mbytes written:整個監控時間內寫的字節數;
- Read/Write Ratio:讀寫比率;
3.右邊的為CPU的總體數據,可以獲取如下信息;
- cpu被User/Sys/Wait所占百分比;
- cpu整體平均空閑率/占有率,以及最大的空閑率/占有率;
- cpu各項數據最大值和平均值的比率;
二、cpu各項詳細的數據
1.CPU_ALL頁面:該頁面可以看到如下圖的CPU整體上在每個監控點的數據,包括User%、Sys%、Wait%、Idle%、CPU%以及CPUs(cpu個數)及對應圖表;
2.CPU_SUMM頁面:該頁面可以看到如下圖的各個CPU在總體數據,包括User%、Sys%、Wait%、Idle%以及對應圖表;
3.cpu00x頁面:這些頁面可以看到各個CPU在每個監控點的數據,包括User%、Sys%、Wait%、Idle%、CPU%以及對應圖表;
三、磁盤各項信息數據
1、DISK_SUMM頁面:記錄各個監控時間點的磁盤讀寫和IO次數,以及一些計算值;如下圖,包括下面一些詳細信息:
- Disk Read KB/s:監控時間間隔內磁盤整體每秒讀取字節數
- Disk Write KB/s:監控時間間隔內磁盤整體每秒寫字節數
- IO/sec:監控時間間隔內磁盤整體平均每秒IO數
- 以及上面是哪個數據對應的Avg、WAvg和Max以及對應圖表,WAvg公式如IF(B73=0,0,MAX(SUMPRODUCT(B2:B71,B2:B71)/SUM(B2:B71)-B73,0)),該數字不應該和AVG相差很大;
2、DISKBSIZE頁面:詳細記錄了各監控時間點每個hdisk的磁盤塊的大小,如我的服務器包括了sda、sda1、sda2、sda3以及dm-0、dm-1、dm-2、dm-3(dm是device mapper(設備映射))以及對應的Avg、WAvg和Max計算值;
3、DISKBUSY頁面:詳細記錄了各監控時間點每個hdisk繁忙情況,包括的點同DISKBSIZE頁面;
4、DISKREAD頁面:詳細記錄了各監控時間點每個hdisk每秒讀的子節數,包括的點同DISKBSIZE頁面;
5、DISKWRITE頁面:詳細記錄了各監控時間點每個hdisk每秒寫的子節數,包括的點同DISKBSIZE頁面;
6、DISKXFER頁面:詳細記錄了各監控時間點每個hdisk每秒的IO次數,包括的點同DISKBSIZE頁面;
四、內存詳細信息
1.MENM頁面:該頁面包含了如下圖各監控時間點內存各方面的信息數據和圖表,主要信息如下:
- memtoatl:服務器總內存,單位M;
- swaptotal:虛擬總內存;
- memfree:剩余總內存;
- swapfree:剩余虛擬內存;
五、網絡信息
1、Net頁面:該頁面包含了每個監控時間點各個網絡適配器的讀寫等數據傳輸速率(千字節/秒),如我的服務器包括適配器有eth0和lo;
2、NETPACKET頁面:該頁面包含了每個監控時間點各個網絡適配器讀寫包的數量;
-------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Ø Sys_summ頁,為服務器資源使用率匯總
我們需求的主要數據為cpu,mem,io和net。如下圖:
將以上內容,如實填寫至測試報告中。
Ø Cpu_all頁,是服務器cpu使用率的詳細數據
我們主要關注的內容為下圖
Cpu使用率分為三部分,系統、用戶和等待,分別對應圖中紅色、藍色和綠色部分。cpu使用率100%的情況,如果紅色占大部分,說明系統進程本身占據大部分cpu資源,可考慮系統是否存在過多僵屍進程或者系統進程存在死循環等原因;如果藍色占大部分,說明用戶進程占用大量cpu資源,可考慮被壓系統是否壓力過大,或者被壓系統存在大量運算等消耗cpu資源的操作。
Ø Mem頁,是服務器內存使用率的概況。
圖內藍色線條為物理內存使用率,紅色線條為虛擬內存使用率。我們統計的內存使用率為:(已用物理內存+已用虛擬內存)/(物理內存+虛擬內存)x100%。
Ø Memnew頁,是服務器內存使用率的詳細數據
我們重點關注下圖:
圖中藍色部分為系統占用內存,紫色為進程占用內存,黃色為文件占用內存。假設出現內存使用率100%的情況,如藍色+紫色部分較低,其余全是黃色部分,則說明系統存在大量文件操作,文件被寫入內存以加速讀寫,不影響內存實際使用效率;如藍色+紫色部分占90%以上,則說明內存使用率較高,需要結合page頁綜合分析是否存在內存泄露等問題。
Ø Page頁,是交換空間的使用情況
pgin每秒鍾所讀入的頁數,包括從文件系統讀取的頁數
pgout每秒鍾所寫出的頁數,包括寫到文件系統的頁數
pgsin每秒鍾從頁面空間所讀取的頁數
pgsout每秒鍾寫到頁面空間的頁數
fsin分析器計算的數據為pgin-pgsin的圖形處理所用
fsout分析器計算的數據為pgout-pgsout的圖形處理所用
如果存在大量的頻繁換入換出現象,則說明物理內存與虛擬內存之間存在頻繁的切換,物理內存可能存在問題。
Ø Disk_SUMM頁,磁盤
Disk Read 每秒讀的千字節數目 圖中為藍色部分
Disk Write 每秒寫的千字節數目 圖中為紅色部分
IO/sec 每秒進行的IO數(一次IO就是控制操作一次讀或寫,IO塊就是讀或寫的大小),圖中為上方黑色的線,報告中寫的是這個參數的值
Ø Net頁 網絡
Total read 每秒接收到的千字節的數目,如圖藍色部分
Total write 每秒發送的千字節的數目,如圖紅色部分
網絡=Total read-Total write
網絡的指標一般要根據設備來確定,百兆網卡的意思是每秒能夠傳輸的網絡流量是100Mbps,即最大的下載速度是12.5MB/s,一般服務器是千兆網卡,即125MB/s
Ø Top頁,是各種使用率的top事件
如下圖,top頁里記錄了各個進程的cpu使用率,mem使用率,disk使用率以及net使用率。我們可以從圖中輕松抓取到最占用cpu或者最占用mem的程序,為調優提供線索。