首先介紹top中一些字段的含義:
VIRT:virtual memory usage 虛擬內存
1、進程“需要的”虛擬內存大小,包括進程使用的庫、代碼、數據等
2、假如進程申請100m的內存,但實際只使用了10m,那么它會增長100m,而不是實際的使用量
RES:resident memory usage 常駐內存
1、進程當前使用的內存大小,但不包括swap out
2、包含其他進程的共享
3、如果申請100m的內存,實際使用10m,它只增長10m,與VIRT相反
4、關於庫占用內存的情況,它只統計加載的庫文件所占內存大小
SHR:shared memory 共享內存
1、除了自身進程的共享內存,也包括其他進程的共享內存
2、雖然進程只使用了幾個共享庫的函數,但它包含了整個共享庫的大小
3、計算某個進程所占的物理內存大小公式:RES – SHR
4、swap out后,它將會降下來
DATA
1、數據占用的內存。如果top沒有顯示,按f鍵可以顯示出來。
2、真正的該程序要求的數據空間,是真正在運行中要使用的。
top 運行中可以通過 top 的內部命令對進程的顯示方式進行控制。內部命令如下:
s – 改變畫面更新頻率
l – 關閉或開啟第一部分第一行 top 信息的表示
t – 關閉或開啟第一部分第二行 Tasks 和第三行 Cpus 信息的表示
m – 關閉或開啟第一部分第四行 Mem 和 第五行 Swap 信息的表示
N – 以 PID 的大小的順序排列表示進程列表
P – 以 CPU 占用率大小的順序排列進程列表
M – 以內存占用率大小的順序排列進程列表
h – 顯示幫助
n – 設置在進程列表所顯示進程的數量
q – 退出 top
s – 改變畫面更新周期
序號 列名 含義
a PID 進程id
b PPID 父進程id
c RUSER Real user name
d UID 進程所有者的用戶id
e USER 進程所有者的用戶名
f GROUP 進程所有者的組名
g TTY 啟動進程的終端名。不是從終端啟動的進程則顯示為 ?
h PR 優先級
i NI nice值。負值表示高優先級,正值表示低優先級
j P 最后使用的CPU,僅在多CPU環境下有意義
k %CPU 上次更新到現在的CPU時間占用百分比
l TIME 進程使用的CPU時間總計,單位秒
m TIME+ 進程使用的CPU時間總計,單位1/100秒
n %MEM 進程使用的物理內存百分比
o VIRT 進程使用的虛擬內存總量,單位kb。VIRT=SWAP+RES
p SWAP 進程使用的虛擬內存中,被換出的大小,單位kb。
q RES 進程使用的、未被換出的物理內存大小,單位kb。RES=CODE+DATA
r CODE 可執行代碼占用的物理內存大小,單位kb
s DATA 可執行代碼以外的部分(數據段+棧)占用的物理內存大小,單位kb
t SHR 共享內存大小,單位kb
u nFLT 頁面錯誤次數
v nDRT 最后一次寫入到現在,被修改過的頁面數。
w S 進程狀態。(D=不可中斷的睡眠狀態,R=運行,S=睡眠,T=跟蹤/停止,Z=僵屍進程)
x COMMAND 命令名/命令行
y WCHAN 若該進程在睡眠,則顯示睡眠中的系統函數名
z Flags 任務標志,參考 sched.h
默認情況下僅顯示比較重要的 PID、USER、PR、NI、VIRT、RES、SHR、S、%CPU、%MEM、TIME+、COMMAND 列。可以通過下面的快捷鍵來更改顯示內容。
通過 f 鍵可以選擇顯示的內容。按 f 鍵之后會顯示列的列表,按 a-z 即可顯示或隱藏對應的列,最后按回車鍵確定。
按 o 鍵可以改變列的顯示順序。按小寫的 a-z 可以將相應的列向右移動,而大寫的 A-Z 可以將相應的列向左移動。最后按回車鍵確定。
按大寫的 F 或 O 鍵,然后按 a-z 可以將進程按照相應的列進行排序。而大寫的 R 鍵可以將當前的排序倒轉。
top使用方法:
使用格式:
top [-] [d] [p] [q] [c] [C] [S] [s] [n]
參數說明:
d:指定每兩次屏幕信息刷新之間的時間間隔。當然用戶可以使用s交互命令來改變之。
p:通過指定監控進程ID來僅僅監控某個進程的狀態。
q:該選項將使top沒有任何延遲的進行刷新。如果調用程序有超級用戶權限,那么top將以盡可能高的優先級運行。
S:指定累計模式。
s:使top命令在安全模式中運行。這將去除交互命令所帶來的潛在危險。
i:使top不顯示任何閑置或者僵死進程。
c:顯示整個命令行而不只是顯示命令名。
常用命令說明:
Ctrl+L:擦除並且重寫屏幕
K:終止一個進程。系統將提示用戶輸入需要終止的進程PID,以及需要發送給該進程什么樣的信號。一般的終止進程可以使用15信號;如果不能正常結束那就使用信號9強制結束該進程。默認值是信號15。在安全模式中此命令被屏蔽。
i:忽略閑置和僵死進程。這是一個開關式命令。
q:退出程序
r:重新安排一個進程的優先級別。系統提示用戶輸入需要改變的進程PID以及需要設置的進程優先級值。輸入一個正值將使優先級降低,反之則可以使該進程擁有更高的優先權。默認值是10。
S:切換到累計模式。
s:改變兩次刷新之間的延遲時間。系統將提示用戶輸入新的時間,單位為s。如果有小數,就換算成m s。輸入0值則系統將不斷刷新,默認值是5 s。需要注意的是如果設置太小的時間,很可能會引起不斷刷新,從而根本來不及看清顯示的情況,而且系統負載也會大大增加。
f或者F:從當前顯示中添加或者刪除項目。
o或者O:改變顯示項目的順序
l:切換顯示平均負載和啟動時間信息。
m:切換顯示內存信息。
t:切換顯示進程和CPU狀態信息。
c:切換顯示命令名稱和完整命令行。
M:根據駐留內存大小進行排序。
P:根據CPU使用百分比大小進行排序。
T:根據時間/累計時間進行排序。
W:將當前設置寫入~/.toprc文件中。
查看多核CPU命令
mpstat -P ALL 和 sar -P ALL
說明:sar -P ALL > aaa.txt 重定向輸出內容到文件 aaa.txt
top命令經常用來監控Linux的系統狀況,比如cpu、內存的使用,程序員基本都知道這個命令,但比較奇怪的是能用好它的人卻很少,例如top監控視圖中內存數值的含義就有不少的曲解。
本文通過一個運行中的WEB服務器的top監控截圖,講述top視圖中的各種數據的含義,還包括視圖中各進程(任務)的字段的排序。
輸入top命令
1.1 系統運行時間和平均負載:

- 當前時間
- 系統已運行的時間
- 當前登錄用戶的數量
- 相應最近5、10和15分鍾內的平均負載。
可以使用'l'命令切換uptime的顯示。
21:45:11 — 當前系統時間
0 days, 4:54 — 系統已經運行了4小時54分鍾(在這期間沒有重啟過)
2 users — 當前有2個用戶登錄系統
load average:0.24, 0.15, 0.19 — load average后面的三個數分別是5分鍾、10分鍾、15分鍾的負載情況。
load average數據是每隔5秒鍾檢查一次活躍的進程數,然后按特定算法計算出的數值。如果這個數除以邏輯CPU的數量,結果高於5的時候就表明系統在超負荷運轉了。
- us, user: 運行(未調整優先級的) 用戶進程的CPU時間
- sy,system: 運行內核進程的CPU時間
- ni,niced:運行已調整優先級的用戶進程的CPU時間
- wa,IO wait: 用於等待IO完成的CPU時間
- hi:處理硬件中斷的CPU時間
- si: 處理軟件中斷的CPU時間
- st:這個虛擬機被hypervisor偷去的CPU時間(譯注:如果當前處於一個hypervisor下的vm,實際上hypervisor也是要消耗一部分CPU處理時間的)。
可以使用't'命令切換顯示。
1.3% us — 用戶空間占用CPU的百分比。1.0% sy — 內核空間占用CPU的百分比。
0.0% ni — 改變過優先級的進程占用CPU的百分比
97.3% id — 空閑CPU百分比
0.0% wa — IO等待占用CPU的百分比
0.3% hi — 硬中斷(Hardware IRQ)占用CPU的百分比
0.0% si — 軟中斷(Software Interrupts)占用CPU的百分比
在這里CPU的使用比率和windows概念不同,如果你不理解用戶空間和內核空間,需要充充電了。
接下來兩行顯示內存使用率,有點像'free'命令。第一行是物理內存使用,第二行是虛擬內存使用(交換空間)。
物理內存顯示如下:全部可用內存、已使用內存、空閑內存、緩沖內存。相似地:交換部分顯示的是:全部、已使用、空閑和緩沖交換空間。
內存顯示可以用'm'命令切換。
509248k total — 物理內存總量(509M)495964k used — 使用中的內存總量(495M)
13284k free — 空閑內存總量(13M)
25364k buffers — 緩存的內存量 (25M)
swap交換分區
492536k total — 交換區總量(492M)
11856k used — 使用的交換區總量(11M)
480680k free — 空閑交換區總量(480M)
202224k cached — 緩沖的交換區總量(202M)
這里要說明的是不能用windows的內存概念理解這些數據,如果按windows的方式此台服務器“危矣”:8G的內存總量只剩下530M的可用內存。Linux的內存管理有其特殊性,復雜點需要一本書來說明,這里只是簡單說點和我們傳統概念(windows)的不同。
第四行中使用中的內存總量(used)指的是現在系統內核控制的內存數,空閑內存總量(free)是內核還未納入其管控范圍的數量。納入內核管理的內存不見得都在使用中,還包括過去使用過的現在可以被重復利用的內存,內核並不把這些可被重新使用的內存交還到free中去,因此在linux上free內存會越來越少,但不用為此擔心。
如果出於習慣去計算可用內存數,這里有個近似的計算公式:第四行的free + 第四行的buffers + 第五行的cached,按這個公式此台服務器的可用內存:
13284+25364+202224 = 240M。
對於內存監控,在top里我們要時刻監控第五行swap交換分區的used,如果這個數值在不斷的變化,說明內核在不斷進行內存和swap的數據交換,這是真正的內存不夠用了。
PID:進程ID,進程的唯一標識符
USER:進程所有者的實際用戶名。
PR:進程的調度優先級。這個字段的一些值是'rt'。這意味這這些進程運行在實時態。
NI:進程的nice值(優先級)。越小的值意味着越高的優先級。負值表示高優先級,正值表示低優先級
VIRT:進程使用的虛擬內存。進程使用的虛擬內存總量,單位kb。VIRT=SWAP+RES
RES:駐留內存大小。駐留內存是任務使用的非交換物理內存大小。進程使用的、未被換出的物理內存大小,單位kb。RES=CODE+DATA
SHR:SHR是進程使用的共享內存。共享內存大小,單位kb
S:這個是進程的狀態。它有以下不同的值:
- D - 不可中斷的睡眠態。
- R – 運行態
- S – 睡眠態
- T – 被跟蹤或已停止
- Z – 僵屍態
%CPU:自從上一次更新時到現在任務所使用的CPU時間百分比。
%MEM:進程使用的可用物理內存百分比。
TIME+:任務啟動后到現在所使用的全部CPU時間,精確到百分之一秒。
COMMAND:運行進程所使用的命令。進程名稱(命令名/命令行)
還有許多在默認情況下不會顯示的輸出,它們可以顯示進程的頁錯誤、有效組和組ID和其他更多的信息。
交互命令
2.1 ‘h’: 幫助
可以用h或?顯示交互命令的幫助菜單。
2.2 ‘<ENTER>’ 或者 ‘<SPACE>’: 刷新顯示
top命令默認在一個特定間隔(3秒)后刷新顯示。要手動刷新,用戶可以輸入回車或者空格。
多U多核CPU監控
在top基本視圖中,按鍵盤數字“1”,可監控每個邏輯CPU的狀況:
top視圖 02
觀察上圖,服務器有16個邏輯CPU,實際上是4個物理CPU。
進程字段排序
默認進入top時,各進程是按照CPU的占用量來排序的,在【top視圖 01】中進程ID為14210的Java進程排在第一(cpu占用100%),進程ID為14183的java進程排在第二(cpu占用12%)。可通過鍵盤指令來改變排序字段,比如想監控哪個進程占用MEM最多,我一般的使用方法如下:
1. 敲擊鍵盤“b”(打開/關閉加亮效果),top的視圖變化如下:
top視圖 03
我們發現進程id為10704的“top”進程被加亮了,top進程就是視圖第二行顯示的唯一的運行態(runing)的那個進程,可以通過敲擊“y”鍵關閉或打開運行態進程的加亮效果。
2. 敲擊鍵盤“x”(打開/關閉排序列的加亮效果),top的視圖變化如下:
top視圖 04
可以看到,top默認的排序列是“%CPU”。
3. 通過”shift + >”或”shift + <”可以向右或左改變排序列,下圖是按一次”shift + >”的效果圖:
top視圖 05
視圖現在已經按照%MEM來排序了。
改變進程顯示字段
1. 敲擊“f”鍵,top進入另一個視圖,在這里可以編排基本視圖中的顯示字段:
top視圖 06
這里列出了所有可在top基本視圖中顯示的進程字段,有”*”並且標注為大寫字母的字段是可顯示的,沒有”*”並且是小寫字母的字段是不顯示的。如果要在基本視圖中顯示“CODE”和“DATA”兩個字段,可以通過敲擊“r”和“s”鍵:
top視圖 07
2. “回車”返回基本視圖,可以看到多了“CODE”和“DATA”兩個字段:
top視圖 08
top命令的補充
top命令是Linux上進行系統監控的首選命令,但有時候卻達不到我們的要求,比如當前這台服務器,top監控有很大的局限性。這台服務器運行着websphere集群,有兩個節點服務,就是【top視圖 01】中的老大、老二兩個java進程,top命令的監控最小單位是進程,所以看不到我關心的java線程數和客戶連接數,而這兩個指標是java的web服務非常重要的指標,通常我用ps和netstate兩個命令來補充top的不足。
監控java線程數:
ps -eLf | grep java | wc -l
監控網絡客戶連接數:
netstat -n | grep tcp | grep 偵聽端口 | wc -l
上面兩個命令,可改動grep的參數,來達到更細致的監控要求。
在Linux系統“一切都是文件”的思想貫徹指導下,所有進程的運行狀態都可以用文件來獲取。系統根目錄/proc中,每一個數字子目錄的名字都是運行中的進程的PID,進入任一個進程目錄,可通過其中文件或目錄來觀察進程的各項運行指標,例如task目錄就是用來描述進程中線程的,因此也可以通過下面的方法獲取某進程中運行中的線程數量(PID指的是進程ID):
ls /proc/PID/task | wc -l
在linux中還有一個命令pmap,來輸出進程內存的狀況,可以用來分析線程堆棧:
pmap PID
來源:https://www.cnblogs.com/zhoug2020/p/6336453.html