如何判斷CPU、內存、磁盤的性能瓶頸？

本文轉載自查看原文 2018-10-09 13:51 1057 性能瓶頸分析

1.如何判斷CPU、內存、磁盤的瓶頸？

CPU瓶頸1) 查看CPU利用率。建議CPU指標如下

　　a) User Time：65%～70%

　　b) System Time：30%～35%

　　c) Idle：0%～5%

　　如果us,sy高於這個指標可以判斷CPU有瓶頸

　　使用top查看

　　查看運行隊列

　　每個CPU都會維持一個運行隊列，理想情況下，調度器會不斷讓隊列中的進程運行。進程不是處在sleep狀態就是run able狀態。如果CPU過載，就會出現調度器跟不上系統的要求，導致可運行的進程會填滿隊列。隊列愈大，程序執行時間就愈長。“load”用來表示運行隊列，用top 命令我們可以看到CPU一分鍾，5分鍾和15分鍾內的運行隊列的大小。這個值越大表明系統負荷越大。超過 1.00，那么說明CPU已經超出負荷，交通嚴重的擁堵。

　　使用top或者uptime查看

　　查看上下文切換

　　每個CPU（或多核CPU中每個核心）在同一時間只能執行一個線程，Linux采用搶占式調度。即為每個線程分配一定的執行時間，當到達執行時間，線程中有IO阻塞或高優先級線程要執行時，Linux將切換執行的線程，在切換時要存儲目前線程的執行狀態，並恢復要執行的線程狀態，這個過程稱之為上下文切換。對於java應用，典型的是在進行文件IO操作，網絡IO操作，鎖等待或線程sleep時，當前線程會進入阻塞或者休眠狀態，從而觸發上下文切換，上下文切換過多會造成內核占用過多的CPU使用，使得應用的響應速度下降。

　　使用vmstat查看cs

結論

檢查system的運行隊列,以及確定不要超出每個處理器3個可運行狀態線程的限制.

　　確定CPU 利用率中user/system比例維持在70/30

　　當CPU 開銷更多的時間在system mode,那就說明已經超負荷並且應該嘗試重新調度優先級

　　當I/O 處理得到增長,CPU 范疇的應用處理將受到影響

　　ps:對於JAVA應用，CPU瓶頸可以通過jprofiler監控分析

內存瓶頸

　 1.查看利用率(free)

　　used:已使用多大。

　　free:可用有多少。

　　Shared:多個進程共享的內存總額。

　　Buffers/cached:磁盤緩存的大小。

　　2.查看頁交換，swap交換（po,pi,so,si），磁盤IO(vmstat)

　　si: 每秒從交換區寫到內存的大小

　　so: 每秒寫入交換區的內存大小

　　page in :分頁(Page)從磁盤重新回到內存的過程被稱作Page-In

　　page out : 分頁(Page)寫入磁盤的過程被稱作Page-Out

　　另外在進行頁交換的時候，會產生磁盤IO，還需注意bi,bo

　　Bo 磁盤塊頁面從內存到文件或交換設備的總額

　　Bi 磁盤塊頁面從文件或交換設備到內存的總額

　　3.page fault（pidstat -r，sar -B )

　　minflt/s: 每秒次缺頁錯誤次數(minor page faults)，次缺頁錯誤次數意即虛擬內存地址映射成物理內存地址產生的page fault次數

　　majflt/s: 每秒主缺頁錯誤次數(major page faults)，當虛擬內存地址映射成物理內存地址時，相應的page在swap中，這樣的page fault為major page fault，一般在內存使用緊張時產生

　　其中sar -B中fault/s表示每秒鍾minflt，majflt的和。

結論

　　監控虛擬內存性能由以下幾個部分組成：

　　1.當系統中出現較少的頁錯誤,獲得最好的響應時間,是因為memory caches(譯注:內存高速緩存)比disk caches更快(譯注:磁盤高速緩存).

　　2.較少的空閑內存,是件好事情,那意味着緩存的使用更有效率.除非在不斷的寫入swap device和disk.

　　3.如果系統不斷報告,swap device總是繁忙中,那就意味着內存已經不足,需要升級了.

　　zee：

　　如果用做緩沖區（buff）和快速緩存（Cache）的物理內存不斷地增加，而空閑的物理內存（free）不斷地減少，證明系統中運行的進程正在不斷地消耗物理內存。

　　已經使用的虛擬內存（swpd）不斷增加，而且存在着大量的頁面交換（si和so），證明物理內存已經不能滿足系統需求，系統必須把物理內存的頁面交換到磁盤中去。

　　由此可以得到這樣的結論：該主機上的物理內存已經不能滿足系統運行的需要，內存已成為該系統性能的一個瓶頸。

　　ps:對於java程序，內存瓶頸可以通過heap dump后使用mat分析

磁盤瓶頸

　　iostat查看IO信息。如果 %util 接近 100%，說明產生的I/O請求太多，I/O系統已經滿負荷，該磁盤可能存在瓶頸。

　　另外還需要注意iowait這個值，iowait 值高就意味着磁盤緩慢或負載過大。還有不要信任svctm這個字段。

　　監控swap 和系統分區,要確保virtual memory不是文件系統I/O 的瓶頸.

　　ps:磁盤瓶頸可以通過pidstat -d 定位程序

2.如何理解CPU、內存、磁盤的關系？

　　這些子系統之間關系是彼此聯系，相互彼此依賴的

　　1.對於進程來說，數據是存放在內存中的，進程的運行需要使用CPU，進程讀寫數據需要跟磁盤打交道。

　　2.當內存不足時需要跟磁盤進行頁(page)交換，swap交換，從而產生磁盤IO。po,so釋放物理內存，pi,si增加物理內存使用。交換分頁的過程需要占用cpu時間。 (內存占用過高)

　　3.當磁盤IO負載過高時，需要監控swap和系統分區，要確保virtual memory不是文件系統I/O 的瓶頸。磁盤的相當慢的，當iowait 增長,表示CPU花費大量的時間在等待磁盤IO，此時CPU Bound的應用處理將受到影響（磁盤IO過高）

　　3.如何理解paging in / paging out ?

　　在Linux內存管理中，主要是通過“調頁Paging”和“交換Swapping”來完成上述的內存調度。調頁算法是將內存中最近不常使用的頁面換到磁盤上，把活動頁面保留在內存中供進程使用。交換技術是將整個進程，而不是部分頁面，全部交換到磁盤上。

　　分頁(Page)寫入磁盤的過程被稱作Page-Out，分頁(Page)從磁盤重新回到內存的過程被稱作Page-In。當內核需要一個分頁時，但發現此分頁不在物理內存中(因為已經被Page-Out了)，此時就發生了分頁錯誤（Page Fault）。

　　當系統內核發現可運行內存變少時，就會通過Page-Out來釋放一部分物理內存。經管Page-Out不是經常發生，但是如果Page-out頻繁不斷的發生，直到當內核管理分頁的時間超過運行程式的時間時，系統效能會急劇下降。這時的系統已經運行非常慢或進入暫停狀態，這種狀態亦被稱作thrashing(顛簸)。

　　可以通過vmstat -s 查看 paged in/out 數量

　　4.如何監控操作系統的資源？

　　CPU監控：top(利用率)， uptime(運行隊列數)， vmstat(上下文切換數)， jprofile(方法占用cpu時間百分比)

　　內存監控:top， free(利用率)， vmstat(page和swap交換)， pidstat -r和sar -B(page fault)， jmap -heap(堆dump)， mat和jprofiler(查看對象)

　　磁盤監控：iostat(%util)， top(iowait%)， pidstat -d

　　網絡監控：netstat(連接數)， nethogs(流量)， wireshark和tcpdump(抓包)

　　JVM監控：jstat(gc)， jmap(堆dump)， jstack(線程dump)， jprofiler和visualvm(剖析工具)

　　nmon(長時間全局收集數據)

　 5.如何理解上下文切換（context switch）?

　　vmstat其中cs那一列

　　7.如何理解磁盤IO？

　　磁盤IO速度是非常慢的，linux內核就是要盡量降低IO

　　內存不足時會進行頁交換，產生磁盤IO

　　CPU Bound類型應用，當磁盤IO過多，iowait過大時會影響性能。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 如何判斷CPU、內存、磁盤的性能瓶頸？性能瓶頸分析（CPU，IO，內存） Windows內存性能分析（二）性能瓶頸性能瓶頸分析總結怎樣查出SQLServer的性能瓶頸 SqlServer性能瓶頸分析 POI AutoSizeColumn() 性能瓶頸性能瓶頸分析方法性能瓶頸調優性能瓶頸分析思路