最近一直遇到CPU飆高,或內存飆高的問題,找了一下查看的命令記錄下來
首先使用 jps -l
查找當前所有的 Java 進程。
jstat 命令
jstat -gc pid 1000
或者 jstat -gc pid 1000 > out.txt
: 每隔1000毫秒打印一次或導出 GC 的狀態。
- S0C S0U:Survivor 0區的大小及使用情況
- S1C S1U:Survivor 1區的大小及使用情況
- EC EU:Eden 區的大小及使用情況
- OC OU:Old 區的大小及使用情況
- PC PU:Perm 區的大小及使用情況(Java 8 中取消)
- MC MU:Metaspace 區的大小及使用情況(Java 8 中用戶替代 Perm 區)
- YGC YGCT:Young Generation Minor GC 的數目及時間
- FGC FGCT:Old Generation Full GC 的數目及時間
- GCT:GC 總時間 = YGCT + FGCT
jmap -heap 命令
jmap -heap pid
或者 jmap -heap pid > out.txt
:打印或導出堆內存使用情況。
例如:
可以查看:
- Heap Configuration 堆的配置
- Heap Usage 對的使用情況,包括 Eden 區, From 區,To 區,Old 區,Perm 區(Java 8 中取消)
-
jmap -dump:live,format=b,file=myjmapfile.txt pid
64位機上使用需要使用如下方式:
jmap -J-d64 -heap pid
jmap -histo 命令
jmap -histo pid
或者 jmap -histo pid > out.txt
:打印或導出堆內存中對象的數量及大小。
例如:
可以查看:
- class name 類的名稱
- instances 類對應的對象的數目
- bytes 類對應的對象的大小
主要分析工具和命令有如下幾種:
1:gc日志輸出
在jvm啟動參數中加入 -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimestamps -XX:+PrintGCApplicationStopedTime,jvm將會按照這些參數順序輸出gc概要信息,詳細信息,gc時間信息,gc造成的應用暫停時間。如果在剛才的參數后面加入參數 -Xloggc:文件路徑,gc信息將會輸出到指定的文件中。其他參數還有
-verbose:gc和-XX:+PrintTenuringDistribution等。
2:jconsole
jconsole是jdk自帶的一個內存分析工具,它提供了圖形界面。可以查看到被監控的jvm的內存信息,線程信息,類加載信息,MBean信息。
jconsole位於jdk目錄下的bin目錄,在windows下是jconsole.exe,在unix和linux下是jconsole.sh,jconsole可以監控本地應用,也可以監控遠程應用。 要監控本地應用,執行jconsole pid,pid就是運行的java進程id,如果不帶上pid參數,則執行jconsole命令后,會看到一個對話框彈出,上面列出了本地的java進程,可以選擇一個進行監控。如果要遠程監控,則要在遠程服務器的jvm參數里加入一些東西,因為jconsole的遠程監控基於jmx的,關於jconsole詳細用法,請見專門介紹jconsle的文章,我也會在博客里專門詳細介紹jconsole。
3:jviusalvm
在JDK6 update 7之后,jdk推出了另外一個工具:jvisualvm,java可視化虛擬機,它不但提供了jconsole類似的功能,還提供了jvm內存和cpu實時診斷,還有手動dump出jvm內存情況,手動執行gc。
和jconsole一樣,運行jviusalvm,在jdk的bin目錄下執行jviusalvm,windows下是jviusalvm.exe,linux和unix下是jviusalvm.sh。
4:jmap
jmap是jdk自帶的jvm內存分析的工具,位於jdk的bin目錄。jdk1.6中jmap命令用法:
Usage:
jmap -histo <pid>
(to connect to running process and print histogram of java object heap
jmap -dump:<dump-options> <pid>
(to connect to running process and dump java heap)
dump-options:
format=b binary default
file=<file> dump heap to <file>
Example: jmap -dump:format=b,file=heap.bin <pid>
jmap -histo <pid>在屏幕上顯示出指定pid的jvm內存狀況。以我本機為例,執行該命令,屏幕顯示:
num #instances #bytes class name
----------------------------------------------
#instance指的是對象數量,#bytes指的是這些對象占用的內存大小,class name指的是對象類型。
再看jmap的dump選項,這個選項是將jvm的堆中內存信息輸出到一個文件中
jmap -dump:file=c:dump.txt pid
注意pid是java進程pid,dump出來的文件用專門分析jvm的內存dump文件的工具來分析即可。
5:jhat
上面說了,有很多工具都能分析jvm的內存dump文件,jhat就是sun jdk6及以上版本自帶的工具,位於jdk的bin目錄,執行 jhat -J -Xmx512m [file] ,file就是dump文件路徑。jhat內置一個簡單的web服務器,此命令執行后,jhat在命令行里顯示分析結果的訪問地址,可以用-port選項指定端口,具體用法可以執行jhat -heap查看幫助信息。訪問指定地址后,就能看到頁面上顯示的信息,比jmap -histo命令顯示的豐富得多,更為詳細。
6:eclipse內存分析器
上面說了jhat,它能分析jvm的dump文件,但是全部是文字顯示,eclipse memory analyzer,是一個eclipse提供用於分析jvm 堆dump的插件,它的分析速度比jhat快,分析結果是圖形界面顯示,比jhat的可讀性更高。其實jvisualvm也可以分析dump文件,也是有圖形界面顯示的。
7:jstat
如果說jmap傾向於分析jvm內存中對象信息的話,那么jsta就是傾向於分析jvm內存的gc情況。都是jvm內存分析工具,但顯然,它們是從不同維度來分析的。jsat常用的參數有很多,如 -gc,-gcutil,-gccause,這些選項具體作用可查看jsat幫助信息,我經常用-gcutil,這個參數的作用不斷的顯示當前指定的jvm內存的垃圾收集的信息。
jstat -gcutil pid 10000
這個命令是每個10秒鍾輸出一次jvm的gc信息,10000指的是間隔時間為10000毫秒。
S0 S1 E O P YGC YGCT FGC FGCT GCT
54.62 0.00 42.87 43.52 86.24 1792 5.093 33 7.670 12.763
額……怎么說呢,要看懂這些信息代表什么意思,還必須對jvm的gc機制有一定的了解才行啊。其實如果對sun的 hot spot jvm的gc比較了解的人,應該很容易看懂這些信息,但是不清楚gc機制的人,有點莫名其妙,所以在這里我還是先講講sun的jvm的gc機制吧。說到gc,其實不僅僅只是java的概念,其實在java之前,就有很多語言有gc的概念了,gc嘛就是垃圾收集的意思,更多的是一種算法性的東西,而跟具體語言沒太大關系,所以關於gc的歷史,gc的主流算法我就不講了,那扯得太遠了,扯得太遠了就是扯淡。sun現在的jvm,內存的管理模型是分代模型,所以gc當然是分代收集了。分代是什么意思呢?就是將對象按照生命周期分成三個層次,分別是:新生代,舊生代,持久代。對象剛開始分配的時候,大部分都在新生代,當新生代gc提交被觸發后了,執行一次新生代范圍內的gc,這叫minor gc,如果執行了幾次minor gc后,還有對象存活,將這些對象轉入舊生代,因為這些對象已經經過了組織的重重考驗了哇。舊生代的gc頻率會更低一些,如果舊生代執行了gc,那就是full gc,因為不是局部gc,而是全內存范圍的gc,這會造成應用停頓,因為全內存收集,必須封鎖內存,不許有新的對象分配到內存,持久代就是一些jvm期間,基本不會消失的對象,例如class的定義,jvm方法區信息,例如靜態塊。需要主要的是,新生代里又分了三個空間:eden,susvivor0,susvivor1,按字面上來理解,就是伊甸園區,幸存1區,幸存2區。新對象分配在eden區中,eden區滿時,采用標記-復制算法,即檢查出eden區存活 的對象,並將這些對象復制到是s0或s1中,然后清空eden區。jvm的gc說開來,不只是這么簡單,例如還有串行收集,並行收集,並發收集,還有着名的火車算法,不過那說得太遠了,現在對這個有大致了解就好。說到這里,再來看一下上面輸出的信息:
S0 S1 E O P YGC YGCT FGC FGCT GCT
54.62 0.00 42.87 43.52 86.24 1792 5.093 33 7.670 12.763
S0:新生代的susvivor0區,空間使用率為5462%
S1:新生代的susvivor1區,空間使用率為0.00%(因為還沒有執行第二次minor收集)
E:eden區,空間使用率42.87%
O:舊生代,空間使用率43.52%
P:持久帶,空間使用率86.24%
YGC:minor gc執行次數1792次
YGCT:minor gc耗費的時間5.093毫秒
FGC:full gc執行次數33
FGCT:full gc耗費的時間7.670毫秒
GCT:gc耗費的總時間12.763毫秒
當然也可以配合linux自帶的命令進行排查:
1. ps命令
ps -aux | sort -k4nr | head -N
- 1
*命令詳解:
1. head
:-N可以指定顯示的行數,默認顯示10行。
2. ps
:參數a指代all——所有的進程,u指代userid——執行該進程的用戶id,x指代顯示所有程序,不以終端機來區分。ps -aux的輸出格式如下:
-
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
-
root 1 0.0 0.0 19352 1308 ? Ss Jul29 0:00 /sbin/init
-
root 2 0.0 0.0 0 0 ? S Jul29 0:00 [kthreadd]
-
root 3 0.0 0.0 0 0 ? S Jul29 0:11 [migration/0]
- 1
- 2
- 3
- 4
- 5
3. sort -k4nr中(k代表從根據哪一個關鍵詞排序,后面的數字4表示按照第四列排序;n指代numberic sort,根據其數值排序;r指代reverse,這里是指反向比較結果,輸出時默認從小到大,反向后從大到小。)。本例中,可以看到%MEM在第4個位置,根據%MEM的數值進行由大到小的排序。-k3表示按照cpu占用率排序。
2. top工具
命令行輸入top
回車,然后按下大寫M按照memory排序,按下大寫P按照CPU排序。
怎樣選擇工具
上面列舉的一些工具,各有利弊,其實如果在開發環境,使用什么樣的工具是無所謂的,只要能得到結果就好。但是在生產環境里,卻不能亂選擇,因為這些工具本身就會耗費大量的系統資源,如果在一個生產服務器壓力很大的時候,貿然執行這些工具,可能會造成很意外的情況。最好不要在服務器本機監控,遠程監控會比較好一些,但是如果要遠程監控,服務器端的啟動腳本要加入一些jvm參數,例如用jconsloe遠程監控tomcat或jboss等,都需要設置jvm的jmx參數,如果僅僅只是分析服務器的內存分配和gc信息,強烈推薦,先用jmap導出服務器端的jvm的堆dump文件,然后再用jhat,或者jvisualvm,或者eclipse內存分析器來分析內存狀況。
top命令
在linux環境下,可以通過top
命令查看各個進程的cpu使用情況,默認按cpu使用率排序

1、上圖中可以看出pid為23344的java進程占用了較多的cpu資源;
2、通過top -Hp 23344
可以查看該進程下各個線程的cpu使用情況;

上圖中可以看出pid為25077的線程占了較多的cpu資源,利用jstack命令可以繼續查看該線程當前的堆棧狀態。
jstack命令
通過top命令定位到cpu占用率較高的線程之后,繼續使用jstack pid
命令查看當前java進程的堆棧狀態

jstack命令生成的thread dump信息包含了JVM中所有存活的線程,為了分析指定線程,必須找出對應線程的調用棧,應該如何找?
在top命令中,已經獲取到了占用cpu資源較高的線程pid,將該pid轉成16進制的值,在thread dump中每個線程都有一個nid,找到對應的nid即可;隔段時間再執行一次stack命令獲取thread dump,區分兩份dump是否有差別,在nid=0x246c的線程調用棧中,發現該線程一直在執行JstackCase類第33行的calculate方法,得到這個信息,就可以檢查對應的代碼是否有問題。
通過thread dump分析線程狀態
除了上述的分析,大多數情況下會基於thead dump分析當前各個線程的運行情況,如是否存在死鎖、是否存在一個線程長時間持有鎖不放等等。
在dump中,線程一般存在如下幾種狀態:
1、RUNNABLE,線程處於執行中
2、BLOCKED,線程被阻塞
3、WAITING,線程正在等待