本文轉載自JVM性能調優經驗總結
說明
調優是一個循序漸進的過程,必然需要經歷多次迭代,最終才能換取一個較好的折中方案。
在JVM調優這個領域,沒有任何一種調優方案是適用於所有應用場景的,同時,切勿極端才能夠達到JVM性能調優的真正目的和意義。
調優策略
核心目標
-
GC的時間足夠的小
-
GC的次數足夠的少
-
發生Full GC的周期足夠的長
前兩個目前是相悖的,要想GC時間小必須要一個更小的堆,要保證GC次數足夠少,必須保證一個更大的堆,我們只能取其平衡。
更大的年輕代必然導致更小的年老代,大的年輕代會延長普通GC的周期,但會增加每次GC的時間;小的年老代會導致更頻繁的Full GC
更小的年輕代必然導致更大年老代,小的年輕代會導致普通GC很頻繁,但每次的GC時間會更短;大的年老代會減少Full GC的頻率
如何選擇應該依賴應用程序對象生命周期的分布情況:如果應用存在大量的臨時對象,應該選擇更大的年輕代;如果存在相對較多的持久對象,年老代應該適當增大。
但很多應用都沒有這樣明顯的特性,在抉擇時應該根據以下兩點:a、本着Full GC盡量少的原則,讓年老代盡量緩存常用對象,JVM的默認比例3:8也是這個道理(B)通過觀察應用一段時間,看其他在峰值時年老代會占多少內存,在不影響FullGC的前提下,根據實際情況加大年輕代,比如可以把比例控制在1:1。但應該給年老代至少預留1/3的增長空間
將新對象預留在年輕代
眾所周知,由於 Full GC 的成本遠遠高於 Minor GC,因此某些情況下需要盡可能將對象分配在年輕代,這在很多情況下是一個明智的選擇。雖然在大部分情況下,JVM 會嘗試在 Eden 區分配對象,但是由於空間緊張等問題,很可能不得不將部分年輕對象提前向年老代壓縮。因此,在 JVM 參數調優時可以為應用程序分配一個合理的年輕代空間,以最大限度避免新對象直接進入年老代的情況發生。
通過設置一個較大的年輕代預留新對象,設置合理的 Survivor 區並且提供 Survivor 區的使用率,可以將年輕對象保存在年輕代。一般來說,Survivor 區的空間不夠,或者占用量達到 50%時,就會使對象進入年老代(不管它的年齡有多大)
我們可以嘗試加上
-XX:TargetSurvivorRatio=90
參數,這樣可以提高 from 區的利用率,使 from 區使用到 90%時,再將對象送入年老代
讓大對象進入年老代
我們在大部分情況下都會選擇將對象分配在年輕代。但是,對於占用內存較多的大對象而言,它的選擇可能就不是這樣的。因為大對象出現在年輕代很可能擾亂年輕代 GC,並破壞年輕代原有的對象結構。因為嘗試在年輕代分配大對象,很可能導致空間不足,為了有足夠的空間容納大對象,JVM 不得不將年輕代中的年輕對象挪到年老代。因為大對象占用空間多,所以可能需要移動大量小的年輕對象進入年老代,這對 GC 相當不利。
基於以上原因,可以將大對象直接分配到年老代,保持年輕代對象結構的完整性,這樣可以提高 GC 的效率。如果一個大對象同時又是一個短命的對象,假設這種情況出現很頻繁,那對於 GC 來說會是一場災難。原本應該用於存放永久對象的年老代,被短命的對象塞滿,這也意味着對堆空間進行了洗牌,擾亂了分代內存回收的基本思路。因此,在軟件開發過程中,應該盡可能避免使用短命的大對象。
可以使用參數
-XX:PetenureSizeThreshold
設置大對象直接進入年老代的閾值。當對象的大小超過這個值時,將直接在年老代分配。參數-XX:PetenureSizeThreshold 只對串行收集器和年輕代並行收集器有效,並行回收收集器不識別這個參數。
設置對象進入年老代的年齡
如何設置對象進入年老代的年齡
堆中的每一個對象都有自己的年齡。一般情況下,年輕對象存放在年輕代,年老對象存放在年老代。為了做到這點,虛擬機為每個對象都維護一個年齡。如果對象在 Eden 區,經過一次 GC 后依然存活,則被移動到 Survivor 區中,對象年齡加 1。以后,如果對象每經過一次 GC 依然存活,則年齡再加 1。當對象年齡達到閾值時,就移入年老代,成為老年對象。
這個閾值的最大值可以通過參數
-XX:MaxTenuringThreshold
來設置,默認值是 15。雖然-XX:MaxTenuringThreshold 的值可能是 15 或者更大,但這不意味着新對象非要達到這個年齡才能進入年老代。事實上,對象實際進入年老代的年齡是虛擬機在運行時根據內存使用情況動態計算的,這個參數指定的是閾值年齡的最大值。即,實際晉升年老代年齡等於動態計算所得的年齡與-XX:MaxTenuringThreshold 中較小的那個。
穩定的 Java 堆 VS 動盪的 Java 堆
一般來說,穩定的堆大小對垃圾回收是有利的。獲得一個穩定的堆大小的方法是使-Xms 和-Xmx 的大小一致,即最大堆和最小堆 (初始堆)一樣
如果這樣設置,系統在運行時堆大小理論上是恆定的,穩定的堆空間可以減少 GC 的次數。因此,很多服務端應用都會將最大堆和最小堆設置為相同的數值。但是,一個不穩定的堆並非毫無用處。穩定的堆大小雖然可以減少 GC 次數,但同時也增加了每次GC的時間。讓堆大小在一個區間中震盪,在系統不需要使用大內存時,壓縮堆空間,使 GC 應對一個較小的堆,可以加快單次 GC 的速度。基於這樣的考慮,JVM 還提供了兩個參數用於壓縮和擴展堆空間。
-XX:MinHeapFreeRatio
參數用來設置堆空間最小空閑比例,默認值是 40。當堆空間的空閑內存小於這個數值時,JVM 便會擴展堆空間。
-XX:MaxHeapFreeRatio
參數用來設置堆空間最大空閑比例,默認值是 70。當堆空間的空閑內存大於這個數值時,便會壓縮堆空間,得到一個較小的堆。
當-Xmx 和-Xms 相等時,-XX:MinHeapFreeRatio 和-XX:MaxHeapFreeRatio 兩個參數無效。
增大吞吐量提升系統性能
吞吐量優先的方案將會盡可能減少系統執行垃圾回收的總時間,故可以考慮關注系統吞吐量的並行回收收集器。在擁有高性能的計算機上,進行吞吐量優先優化,可以使用參數:
java –Xmx3800m –Xms3800m –Xmn2G –Xss128k –XX:+UseParallelGC
–XX:ParallelGC-Threads=20 –XX:+UseParallelOldGC
–Xmx380m –Xms3800m:設置 Java 堆的最大值和初始值。一般情況下,為了避免堆內存的頻繁震盪,導致系統性能下降,我們的做法是設置最大堆等於最小堆。假設這里把最小堆減少為最大堆的一半,即 1900m,那么 JVM 會盡可能在 1900MB 堆空間中運行,如果這樣,發生 GC 的可能性就會比較高;
-Xss128k:減少線程棧的大小,這樣可以使剩余的系統內存支持更多的線程;
-Xmn2g:設置年輕代區域大小為 2GB;
–XX:+UseParallelGC:年輕代使用並行垃圾回收收集器。這是一個關注吞吐量的收集器,可以盡可能地減少 GC 時間。
–XX:ParallelGC-Threads:設置用於垃圾回收的線程數,通常情況下,可以設置和 CPU 數量相等。但在 CPU 數量比較多的情況下,設置相對較小的數值也是合理的;
–XX:+UseParallelOldGC:設置年老代使用並行回收收集器。
嘗試使用大的內存分頁
CPU 是通過尋址來訪問內存的。32 位 CPU 的尋址寬度是 0~0xFFFFFFFF ,計算后得到的大小是 4G,也就是說可支持的物理內存最大是 4G。但在實踐過程中,碰到了這樣的問題,程序需要使用 4G 內存,而可用物理內存小於 4G,導致程序不得不降低內存占用。為了解決此類問題,現代 CPU 引入了 MMU(Memory Management Unit 內存管理單元)。MMU 的核心思想是利用虛擬地址替代物理地址,即 CPU 尋址時使用虛址,由 MMU 負責將虛址映射為物理地址。MMU 的引入,解決了對物理內存的限制,對程序來說,就像自己在使用 4G 內存一樣。內存分頁 (Paging) 是在使用 MMU 的基礎上,提出的一種內存管理機制。它將虛擬地址和物理地址按固定大小(4K)分割成頁 (page) 和頁幀 (page frame),並保證頁與頁幀的大小相同。這種機制,從數據結構上,保證了訪問內存的高效,並使 OS 能支持非連續性的內存分配。在程序內存不夠用時,還可以將不常用的物理內存頁轉移到其他存儲設備上,比如磁盤,這就是大家耳熟能詳的虛擬內存。
在 Solaris 系統中,JVM 可以支持 Large Page Size 的使用。使用大的內存分頁可以增強 CPU 的內存尋址能力,從而提升系統的性能。
java –Xmx2506m –Xms2506m –Xmn1536m –Xss128k –XX:++UseParallelGC
–XX:ParallelGCThreads=20 –XX:+UseParallelOldGC –XX:+LargePageSizeInBytes=256m
–XX:+LargePageSizeInBytes:設置大頁的大小。
過大的內存分頁會導致 JVM 在計算 Heap 內部分區(perm, new, old)內存占用比例時,會出現超出正常值的划分,最壞情況下某個區會多占用一個頁的大小。
使用非占有的垃圾回收器
為降低應用軟件的垃圾回收時的停頓,首先考慮的是使用關注系統停頓的 CMS 回收器,其次,為了減少 Full GC 次數,應盡可能將對象預留在年輕代,因為年輕代 Minor GC 的成本遠遠小於年老代的 Full GC。
java –Xmx3550m –Xms3550m –Xmn2g –Xss128k –XX:ParallelGCThreads=20
–XX:+UseConcMarkSweepGC –XX:+UseParNewGC –XX:+SurvivorRatio=8 –XX:TargetSurvivorRatio=90
–XX:MaxTenuringThreshold=31
–XX:ParallelGCThreads=20:設置 20 個線程進行垃圾回收;
–XX:+UseParNewGC:年輕代使用並行回收器;
–XX:+UseConcMarkSweepGC:年老代使用 CMS 收集器降低停頓;
–XX:+SurvivorRatio:設置 Eden 區和 Survivor 區的比例為 8:1。稍大的 Survivor 空間可以提高在年輕代回收生命周期較短的對象的可能性,如果 Survivor 不夠大,一些短命的對象可能直接進入年老代,這對系統來說是不利的。
–XX:TargetSurvivorRatio=90:設置 Survivor 區的可使用率。這里設置為 90%,則允許 90%的 Survivor 空間被使用。默認值是 50%。故該設置提高了 Survivor 區的使用率。當存放的對象超過這個百分比,則對象會向年老代壓縮。因此,這個選項更有助於將對象留在年輕代。
–XX:MaxTenuringThreshold:設置年輕對象晉升到年老代的年齡。默認值是 15 次,即對象經過 15 次 Minor GC 依然存活,則進入年老代。這里設置為 31,目的是讓對象盡可能地保存在年輕代區域。
一些監測JVM的命令
- jps
列出正在運行的虛擬機進程
- jstat
監視虛擬機運行狀態信息
- jmap
生成堆存儲快照
- jstack
生成虛擬機當前時刻的線程快照,幫助定位線程出現長時間停頓的原因
一些JVM參數
設定堆內存大小
- -Xms:啟動JVM時的堆內存空間。
- -Xmx:堆內存最大限制。
- -Xmn:設置年輕代大小整個堆大小=年輕代大小 + 年老代大小 + 持久代大小,Sun官方推薦配置為整個堆的3/8
- -XX:PermSize=128M設置持久代大小
- -XX:MaxPermSize=128M設置持久代最大值,此值可以設置與-XX:PermSize相同,防止持久代內存伸縮,持久代設置很重要,一般預留其使用空間的1/3.
設定新生代大小。
- -XX:NewRatio:新生代和老年代的占比。
- -XX:NewSize:新生代空間。
- -XX:SurvivorRatio:伊甸園空間和幸存者空間的占比。
- -XX:MaxTenuringThreshold:對象進入老年代的年齡閾值。
設定垃圾回收器
- -XX:+UseSerialGC 開啟串行收集器
- -XX:+UseParallelGC開啟年輕代並行收集器,JDK5.0以上,JVM會根據系統配置自行設置,所以無需再設置此值
- -XX:+UseParallelOldGC開啟老年代並行收集器
- -XX:+UseConcMarkSweepGC開啟老年代並發收集器(簡稱CMS),可以和UseParallelGC一起使用
- -XX:CMSInitiatingOccupancyFraction=70老年代內存使用比例到多少激活CMS收集器,這個數值的設置有很大技巧基本上滿足(Xmx-Xmn)*(100-CMSInitiatingOccupancyFraction)/100>=Xmn否則會出現“Concurrent Mode Failure”,promotionfailed,官方建議數值為68
- -XX:+UseCMSCompactAtFullCollection:使用並發收集器時,開啟對年老代的壓縮
其他
- -Xss: 設置每個線程的堆棧大小,設置每個線程的堆棧大小。JDK5.0以后每個線程堆棧大小為1M,以前每個線程堆棧大小為256K。更具應用的線程所需內存大小進行調整。在相同物理內存下,減小這個值能生成更多的線程。但是操作系統對一個進程內的線程數還是有限制的,不能無限生成,經驗值在3000~5000左右,這個參數對性能的影響比較大的
- -XX:MaxTenuringThreshold=0:設置垃圾最大年齡。如果設置為0的話,則年輕代對象不經過Survivor區,直接進入年老代。對於年老代比較多的應用,可以提高效率。如果將此值設置為一個較大值,則年輕代對象會在Survivor區進行多次復制,這樣可以增加對象再年輕代的存活時間,增加在年輕代即被回收的概論,linux64的java6默認值是15
- -XX:ParallelGCThreads=設置並行垃圾回收的線程數。此值可以設置與機器處理器數量相等(邏輯cpu數),這個不確定是物理、還是邏輯使用默認就好
- -XX:MaxGCPauseMillis=指定垃圾回收時的最長暫停時間,單位毫秒,如果指定了此值的話,堆大小和垃圾回收相關參數會進行調整以達到指定值,設定此值可能會減少應用的吞吐量
- -XX:GCTimeRatio=設定吞吐量為垃圾回收時間與非垃圾回收時間的比值,公式為1/(1+N)。例如,-XX:GCTimeRatio=19時,表示5%的時間用於垃圾回收。默認情況為99,即1%的時間用於垃圾回收
- -XX:+UseAdaptiveSizePolicy:設置此選項后,並行收集器會自動選擇年輕代區大小和相應的Survivor區比例,以達到目標系統規定的最低相應時間或者收集頻率等,此值建議使用並行收集器時,一直打開
- -XX:+DisableExplicitGC:禁止 java 程序中的 full gc, 如System.gc() 的調用. 最好加上, 防止程序在代碼里誤用了對性能造成沖擊
- -XX:+PrintGCDetails 打應垃圾收集的情況
- -XX:+PrintGCTimeStamps 打應垃圾收集的情況
- -XX:+PrintGCApplicationConcurrentTime:打印每次垃圾回收前,程序未中斷的執行時間。可與上面混合使用
- -XX:+PrintGCApplicationStoppedTime 打應垃圾收集時 , 系統的停頓時間
- -XX:+PrintGC 打印GC情況
- -XX:PrintHeapAtGC:打印GC前后的詳細堆棧信息
(本文完)
參考: