Xms 是指設定程序啟動時占用內存大小。一般來講,大點,程序會啟動的快一點,但是也可能會導致機器暫時間變慢。
Xmx 是指設定程序運行期間最大可占用的內存大小。如果程序運行需要占用更多的內存,超出了這個設置值,就會拋出OutOfMemory異常。
Xss 是指設定每個線程的堆棧大小。這個就要依據你的程序,看一個線程大約需要占用多少內存,可能會有多少線程同時運行等。
以上三個參數的設置都是默認以Byte為單位的,也可以在數字后面添加[k/K]或者[m/M]來表示KB或者MB。而且,超過機器本身的內存大小也是不可以的,否則就等着機器變慢而不是程序變慢了。
- -Xms 為jvm啟動時分配的內存,比如-Xms200m,表示分配200M
- -Xmx 為jvm運行過程中分配的最大內存,比如-Xms500m,表示jvm進程最多只能夠占用500M內存
- -Xss 為jvm啟動的每個線程分配的內存大小,默認JDK1.4中是256K,JDK1.5+中是1M
Total Memory | -Xms | -Xmx | -Xss | Spare Memory | JDK | Thread Count |
1024M | 256M | 256M | 256K | 768M | 1.4 | 3072 |
1024M | 256M | 256M | 256K | 768M | 1.5 | 768 |
上面的表格只是大致的估計了下在特定內存條件下可以在java中創建的最大線程數。隨着-Xmx的加大,空閑的內存數就更少,那么可以創建的線程也就更少,同時在JDK1.4和1.5版本不同下,可創建的線程數也會根據每個線程的內存大小不同而不同。
其實只要我們了解了JVM的內存大小指定以及java中線程的內存模型,基本上我們就可以很好的控制如何在java中使用線程和避免內存溢出或錯誤的問題了。
最近在網上看到一些人討論到java.lang.Runtime類中的 freeMemory(), totalMemory(), maxMemory()這幾個方法的一些問題,很多人感到很疑惑,為什么,在java程序剛剛啟動起來的時候freeMemory()這個方法返回的只有一兩兆字節,而隨着java程序往前運行,創建了不少的對象,freeMemory()這個方法的返回有時候不但沒有減少,反而會增加。這些人對 freeMemory()這個方法的意義應該有一些誤解,他們認為這個方法返回的是操作系統的剩余可用內存,其實根本就不是這樣的。這三個方法反映的都是 java這個進程的內存情況,跟操作系統的內存根本沒有關系。下面結合totalMemory(), maxMemory()一起來解釋。
maxMemory()這個方法返回的是java虛擬機(這個進程)能構從操作系統那里挖到的最大的內存,以字節為單位,如果在運行java程序的時候,沒有添加-Xmx參數,那么就是64兆,也就是說maxMemory()返回的大約是64*1024*1024字節,這是java虛擬機默認情況下能從操作系統那里挖到的最大的內存。如果添加了-Xmx參數,將以這個參數后面的值為准,例如java -cp you_classpath -Xmx512m your_class,那么最大內存就是512*1024*1024字節。
totalMemory()這個方法返回的是java虛擬機現在已經從操作系統那里挖過來的內存大小,也就是java虛擬機這個進程當時所占用的所有內存。如果在運行java的時候沒有添加-Xms參數,那么,在java程序運行的過程的,內存總是慢慢的從操作系統那里挖的,基本上是用多少挖多少,直到挖到maxMemory()為止,所以totalMemory()是慢慢增大的。如果用了-Xms參數,程序在啟動的時候就會無條件的從操作系統中挖 -Xms后面定義的內存數,然后在這些內存用的差不多的時候,再去挖。
freeMemory()是什么呢,剛才講到如果在運行java的時候沒有添加-Xms參數,那么,在java程序運行的過程的,內存總是慢慢的從操作系統那里挖的,基本上是用多少挖多少,但是java虛擬機100%的情況下是會稍微多挖一點的,這些挖過來而又沒有用上的內存,實際上就是 freeMemory(),所以freeMemory()的值一般情況下都是很小的,但是如果你在運行java程序的時候使用了-Xms,這個時候因為程序在啟動的時候就會無條件的從操作系統中挖-Xms后面定義的內存數,這個時候,挖過來的內存可能大部分沒用上,所以這個時候freeMemory()可能會有些大。
- 堆大小設置
JVM 中最大堆大小有三方面限制:相關操作系統的數據模型(32-bt還是64-bit)限制;系統的可用虛擬內存限制;系統的可用物理內存限制。32位系統下,一般限制在1.5G~2G;64為操作系統對內存無限制。我在Windows Server 2003 系統,3.5G物理內存,JDK5.0下測試,最大可設置為1478m。
典型設置:- java -Xmx3550m -Xms3550m -Xmn2g -Xss128k
- Xmx3550m :設置JVM最大可用內存為3550M。
-Xms3550m :設置JVM促使內存為3550m。此值可以設置與-Xmx相同,以避免每次垃圾回收完成后JVM重新分配內存。
-Xmn2g :設置年輕代大小為2G。整個堆大小=年輕代大小 + 年老代大小 + 持久代大小 。持久代一般固定大小為64m,所以增大年輕代后,將會減小年老代大小。此值對系統性能影響較大,Sun官方推薦配置為整個堆的3/8。
-Xss128k :設置每個線程的堆棧大小。JDK5.0以后每個線程堆棧大小為1M,以前每個線程堆棧大小為256K。更具應用的線程所需內存大小進行調整。在相同物理內存下,減小這個值能生成更多的線程。但是操作系統對一個進程內的線程數還是有限制的,不能無限生成,經驗值在3000~5000左右。 - java -Xmx3550m -Xms3550m -Xss128k -XX:NewRatio=4 -XX:SurvivorRatio=4 -XX:MaxPermSize=16m -XX:MaxTenuringThreshold=0
-XX:NewRatio=4 :設置年輕代(包括Eden和兩個Survivor區)與年老代的比值(除去持久代)。設置為4,則年輕代與年老代所占比值為1:4,年輕代占整個堆棧的1/5
-XX:SurvivorRatio=4 :設置年輕代中Eden區與Survivor區的大小比值。設置為4,則兩個Survivor區與一個Eden區的比值為2:4,一個Survivor區占整個年輕代的1/6
-XX:MaxPermSize=16m :設置持久代大小為16m。
-XX:MaxTenuringThreshold=0 :設置垃圾最大年齡。如果設置為0的話,則年輕代對象不經過Survivor區,直接進入年老代 。對於年老代比較多的應用,可以提高效率。如果將此值設置為一個較大值,則年輕代對象會在Survivor區進行多次復制,這樣可以增加對象再年輕代的存活時間 ,增加在年輕代即被回收的概論。
- java -Xmx3550m -Xms3550m -Xmn2g -Xss128k
- 回收器選擇
JVM給了三種選擇:串行收集器、並行收集器、並發收集器 ,但是串行收集器只適用於小數據量的情況,所以這里的選擇主要針對並行收集器和並發收集器。默認情況下,JDK5.0以前都是使用串行收集器,如果想使用其他收集器需要在啟動時加入相應參數。JDK5.0以后,JVM會根據當前系統配置 進行判斷。- 吞吐量優先 的並行收集器
如上文所述,並行收集器主要以到達一定的吞吐量為目標,適用於科學技術和后台處理等。
典型配置 :- java -Xmx3800m -Xms3800m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:ParallelGCThreads=20
-XX:+UseParallelGC :選擇垃圾收集器為並行收集器。 此配置僅對年輕代有效。即上述配置下,年輕代使用並發收集,而年老代仍舊使用串行收集。
-XX:ParallelGCThreads=20 :配置並行收集器的線程數,即:同時多少個線程一起進行垃圾回收。此值最好配置與處理器數目相等。 - java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:ParallelGCThreads=20 -XX:+UseParallelOldGC
-XX:+UseParallelOldGC :配置年老代垃圾收集方式為並行收集。JDK6.0支持對年老代並行收集。 - java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:MaxGCPauseMillis=100
-XX:MaxGCPauseMillis=100 : 設置每次年輕代垃圾回收的最長時間,如果無法滿足此時間,JVM會自動調整年輕代大小,以滿足此值。 - java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:MaxGCPauseMillis=100 -XX:+UseAdaptiveSizePolicy
-XX:+UseAdaptiveSizePolicy :設置此選項后,並行收集器會自動選擇年輕代區大小和相應的Survivor區比例,以達到目標系統規定的最低相應時間或者收集頻率等,此值建議使用並行收集器時,一直打開。
- java -Xmx3800m -Xms3800m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:ParallelGCThreads=20
- 響應時間優先 的並發收集器
如上文所述,並發收集器主要是保證系統的響應時間,減少垃圾收集時的停頓時間。適用於應用服務器、電信領域等。
典型配置 :- java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:ParallelGCThreads=20 -XX:+UseConcMarkSweepGC -XX:+UseParNewGC
-XX:+UseConcMarkSweepGC :設置年老代為並發收集。測試中配置這個以后,-XX:NewRatio=4的配置失效了,原因不明。所以,此時年輕代大小最好用-Xmn設置。
-XX:+UseParNewGC :設置年輕代為並行收集。可與CMS收集同時使用。JDK5.0以上,JVM會根據系統配置自行設置,所以無需再設置此值。 - java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseConcMarkSweepGC -XX:CMSFullGCsBeforeCompaction=5 -XX:+UseCMSCompactAtFullCollection
-XX:CMSFullGCsBeforeCompaction :由於並發收集器不對內存空間進行壓縮、整理,所以運行一段時間以后會產生“碎片”,使得運行效率降低。此值設置運行多少次GC以后對內存空間進行壓縮、整理。
-XX:+UseCMSCompactAtFullCollection :打開對年老代的壓縮。可能會影響性能,但是可以消除碎片
- java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:ParallelGCThreads=20 -XX:+UseConcMarkSweepGC -XX:+UseParNewGC
- 吞吐量優先 的並行收集器
- 輔助信息
JVM提供了大量命令行參數,打印信息,供調試使用。主要有以下一些:- -XX:+PrintGC
輸出形式:[GC 118250K->113543K(130112K), 0.0094143 secs][Full GC 121376K->10414K(130112K), 0.0650971 secs]
- -XX:+PrintGCDetails
輸出形式:[GC [DefNew: 8614K->781K(9088K), 0.0123035 secs] 118250K->113543K(130112K), 0.0124633 secs][GC [DefNew: 8614K->8614K(9088K), 0.0000665 secs][Tenured: 112761K->10414K(121024K), 0.0433488 secs] 121376K->10414K(130112K), 0.0436268 secs]
- -XX:+PrintGCTimeStamps -XX:+PrintGC:PrintGCTimeStamps可與上面兩個混合使用
輸出形式:11.851: [GC 98328K->93620K(130112K), 0.0082960 secs] - -XX:+PrintGCApplicationConcurrentTime: 打印每次垃圾回收前,程序未中斷的執行時間。可與上面混合使用
輸出形式:Application time: 0.5291524 seconds - -XX:+PrintGCApplicationStoppedTime :打印垃圾回收期間程序暫停的時間。可與上面混合使用
輸出形式:Total time for which application threads were stopped: 0.0468229 seconds - -XX:PrintHeapAtGC :打印GC前后的詳細堆棧信息
輸出形式:
34.702: [GC {Heap before gc invocations=7:
def new generation total 55296K, used 52568K [0x1ebd0000, 0x227d0000, 0x227d0000)
eden space 49152K, 99% used [0x1ebd0000, 0x21bce430, 0x21bd0000)
from space 6144K, 55% used [0x221d0000, 0x22527e10, 0x227d0000)
to space 6144K, 0% used [0x21bd0000, 0x21bd0000, 0x221d0000)
tenured generation total 69632K, used 2696K [0x227d0000, 0x26bd0000, 0x26bd0000)
the space 69632K, 3% used [0x227d0000, 0x22a720f8, 0x22a72200, 0x26bd0000)
compacting perm gen total 8192K, used 2898K [0x26bd0000, 0x273d0000, 0x2abd0000)
the space 8192K, 35% used [0x26bd0000, 0x26ea4ba8, 0x26ea4c00, 0x273d0000)
ro space 8192K, 66% used [0x2abd0000, 0x2b12bcc0, 0x2b12be00, 0x2b3d0000)
rw space 12288K, 46% used [0x2b3d0000, 0x2b972060, 0x2b972200, 0x2bfd0000)
34.735: [DefNew: 52568K->3433K(55296K), 0.0072126 secs] 55264K->6615K(124928K)Heap after gc invocations=8:
def new generation total 55296K, used 3433K [0x1ebd0000, 0x227d0000, 0x227d0000)
eden space 49152K, 0% used [0x1ebd0000, 0x1ebd0000, 0x21bd0000)
from space 6144K, 55% used [0x21bd0000, 0x21f2a5e8, 0x221d0000)
to space 6144K, 0% used [0x221d0000, 0x221d0000, 0x227d0000)
tenured generation total 69632K, used 3182K [0x227d0000, 0x26bd0000, 0x26bd0000)
the space 69632K, 4% used [0x227d0000, 0x22aeb958, 0x22aeba00, 0x26bd0000)
compacting perm gen total 8192K, used 2898K [0x26bd0000, 0x273d0000, 0x2abd0000)
the space 8192K, 35% used [0x26bd0000, 0x26ea4ba8, 0x26ea4c00, 0x273d0000)
ro space 8192K, 66% used [0x2abd0000, 0x2b12bcc0, 0x2b12be00, 0x2b3d0000)
rw space 12288K, 46% used [0x2b3d0000, 0x2b972060, 0x2b972200, 0x2bfd0000)
}
, 0.0757599 secs] - -Xloggc:filename :與上面幾個配合使用,把相關日志信息記錄到文件以便分析。
- -XX:+PrintGC
- 常見配置匯總
- 堆設置
- -Xms :初始堆大小
- -Xmx :最大堆大小
- -XX:NewSize=n :設置年輕代大小
- -XX:NewRatio=n: 設置年輕代和年老代的比值。如:為3,表示年輕代與年老代比值為1:3,年輕代占整個年輕代年老代和的1/4
- -XX:SurvivorRatio=n :年輕代中Eden區與兩個Survivor區的比值。注意Survivor區有兩個。如:3,表示Eden:Survivor=3:2,一個Survivor區占整個年輕代的1/5
- -XX:MaxPermSize=n :設置持久代大小
- 收集器設置
- -XX:+UseSerialGC :設置串行收集器
- -XX:+UseParallelGC :設置並行收集器
- -XX:+UseParalledlOldGC :設置並行年老代收集器
- -XX:+UseConcMarkSweepGC :設置並發收集器
- 垃圾回收統計信息
- -XX:+PrintGC
- -XX:+PrintGCDetails
- -XX:+PrintGCTimeStamps
- -Xloggc:filename
- 並行收集器設置
- -XX:ParallelGCThreads=n :設置並行收集器收集時使用的CPU數。並行收集線程數。
- -XX:MaxGCPauseMillis=n :設置並行收集最大暫停時間
- -XX:GCTimeRatio=n :設置垃圾回收時間占程序運行時間的百分比。公式為1/(1+n)
- 並發收集器設置
- -XX:+CMSIncrementalMode :設置為增量模式。適用於單CPU情況。
- -XX:ParallelGCThreads=n :設置並發收集器年輕代收集方式為並行收集時,使用的CPU數。並行收集線程數。
- 堆設置
四、調優總結
- 年輕代大小選擇
- 響應時間優先的應用 :盡可能設大,直到接近系統的最低響應時間限制 (根據實際情況選擇)。在此種情況下,年輕代收集發生的頻率也是最小的。同時,減少到達年老代的對象。
- 吞吐量優先的應用 :盡可能的設置大,可能到達Gbit的程度。因為對響應時間沒有要求,垃圾收集可以並行進行,一般適合8CPU以上的應用。
- 年老代大小選擇
- 響應時間優先的應用 :年老代使用並發收集器,所以其大小需要小心設置,一般要考慮並發會話率 和會話持續時間 等一些參數。如果堆設置小了,可以會造成內存碎片、高回收頻率以及應用暫停而使用傳統的標記清除方式;如果堆大了,則需要較長的收集時間。最優化的方案,一般需要參考以下數據獲得:
- 並發垃圾收集信息
- 持久代並發收集次數
- 傳統GC信息
- 花在年輕代和年老代回收上的時間比例
- 吞吐量優先的應用 :一般吞吐量優先的應用都有一個很大的年輕代和一個較小的年老代。原因是,這樣可以盡可能回收掉大部分短期對象,減少中期的對象,而年老代盡存放長期存活對象。
- 響應時間優先的應用 :年老代使用並發收集器,所以其大小需要小心設置,一般要考慮並發會話率 和會話持續時間 等一些參數。如果堆設置小了,可以會造成內存碎片、高回收頻率以及應用暫停而使用傳統的標記清除方式;如果堆大了,則需要較長的收集時間。最優化的方案,一般需要參考以下數據獲得:
- 較小堆引起的碎片問題
因為年老代的並發收集器使用標記、清除算法,所以不會對堆進行壓縮。當收集器回收時,他會把相鄰的空間進行合並,這樣可以分配給較大的對象。但是,當堆空間較小時,運行一段時間以后,就會出現“碎片”,如果並發收集器找不到足夠的空間,那么並發收集器將會停止,然后使用傳統的標記、清除方式進行回收。如果出現“碎片”,可能需要進行如下配置:- -XX:+UseCMSCompactAtFullCollection :使用並發收集器時,開啟對年老代的壓縮。
- -XX:CMSFullGCsBeforeCompaction=0 :上面配置開啟的情況下,這里設置多少次Full GC后,對年老代進行壓縮
我在tomcat中的jvm連接數,和tomcat優化的使用如下:
1、 tomcat7安裝目錄\bin\catalina.bat (linux修改的是catalina.sh文件)
添加如下語句:
JAVA_OPTS=-Djava.awt.headless=true -Dfile.encoding=UTF-8 -server -Xms1024m -Xmx1024m -Xss1m -XX:NewSize=256m -XX:MaxNewSize=512m -XX:PermSize=256M -XX:MaxPermSize=512m
-XX:+DisableExplicitGC
2、查看tomcat的JVM內存
tomcat7中默認沒有用戶的,我們首先要添加用戶有:
修改tomcat7安裝目錄下\conf\tomcat-users.xml
<!--############################################################-->
<!--添加tomcat用戶管理-->
<rol rolename="manager-gui"/>
<user username="tomcat" password="tomcat" roles="manager-gui"/>
<!--############################################################-->
password是可以自由定義的。
3、檢查webapps下是否有Manager目錄,一般發布時我們都把這個目錄刪除了,現在看來刪除早了,在調試期要保留啊!
4、訪問地址:
http://localhost:8080/manager/status
查看內存配置情況,經測試-Xms512m -Xmx512m與-Xms1024m -Xmx1024m內存使用情況不一樣,使用1024的時候有一項內存使用99%。所以看來這個設置多少與實際機器有關,需要Manager進行查看后確定。
5、在啟動Tomcat中發現,有同志發布程序時把我們在TOMCAT7中引用的外部JAR包重復發布到LIB目錄下了,我們以后在發布時要檢查LIB下是不是包括
el-api.jar jsp-api servlet-api,特別注意的是最后一個servlet-api,我發現兩個項目都把它拷貝到了LIB目錄下!!被我刪除了。
6、使用TOMAT的連接池:
<Executor name="tomcatThreadPool" namePrefix="catalina-exec-" maxThreads="300" minSpareThreads="50" maxIdleTime="15000"/>
<Connector port="8080
executor="tomcatThreadPool"
protocol="org.apache.coyote.http11.Http11NioProtocol"
redirectPort="8443"
connectionTimeout="30000"
enableLookups="false"
keepAliveTimeout="15000"
URIEncoding="UTF-8"
maxHttpHeaderSize="32768"
acceptCount="200"/>
說明:
maxThreads:最大線程數 300
minSpareThreads:初始化建立的線程數 50
maxThreads:一旦線程超過這個值,Tomcat就會關閉不再需要的線程
maxIdleTime:為最大空閑時間、單位為毫秒。
executor為線程池的名字,對應Executor 中的name屬性;Connector 標簽中不再有maxThreads的設置。
如果tomcat不使用線程池則基本配置如下:
<Connector port="8080"
protocol="HTTP/1.1"
redirectPort="8443"
connectionTimeout="30000"
keepAliveTimeout="15000"
enableLookups="false"
URIEncoding="UTF-8"
maxHttpHeaderSize="32768"
maxThreads="300"
acceptCount="200"
/>
修改Tomcat的/conf目錄下面的server.xml文件,針對端口為8080的連接器添加如下參數:
1. connectionTimeout:連接失效時間,單位為毫秒、默認為60s、這里設置為30s,如果用戶請求在30s內未能進入請求隊列,視為本次連接失敗。
2. keepAliveTimeout:連接的存活時間,默認和connectionTimeout一致,這里可以設為15s、這意味着15s之后本次連接關閉. 如果頁面需要加載大量圖片、js等靜態資源,需要將參數適當調大一點、以免多次創建TCP連接。
3. enableLookups:是否對連接到服務器的遠程機器查詢其DNS主機名,一般情況下這並不必要,因此設為false即可。
4. URIEncoding:設置URL參數的編碼格式為UTF-8編碼,默認為ISO-8859-1編碼。
5. maxHttpHeaderSize:設置HTTP請求、響應的頭部內容大小,默認為8192字節(8k),此處設置為32768字節(32k)、和Nginx的設置保持一致。
6. maxThreads:最大線程數、用於處理用戶請求的線程數目,默認為200、此處設置為300
7. acceptCount:用戶請求等候隊列的大小,默認為100、此處設置為200
Linux系統默認一個進程能夠創建的最大線程數為1024、因此對高並發應用需要進行Linux內核調優,至此文件server.xml修改后的內容如下所示:
再次登錄查看狀態,
http://localhost:8080/manager/status
用戶名、密碼就是上邊配置的。根據cpu、內存的大小來配置。
參考:
http://blog.sina.com.cn/s/blog_3f12afd00100zpvf.html
tomcat7 正式環境的優化
http://energykey.iteye.com/blog/2072797
tomcat內存配置優化
http://blog.csdn.net/kefeng824/article/details/31742423
CentOS 6.5 下的tomcat優化
http://www.cnblogs.com/littlehb/archive/2013/04/02/2994785.html
JVM(Java虛擬機)優化大全和案例實戰--(重點推薦)