轉載注明出處: http://blog.csdn.net/cutesource/article/details/5904501
JVM工作原理和特點主要是指操作系統裝入JVM是通過jdk中Java.exe來完成,通過下面4步來完成JVM環境.
1.創建JVM裝載環境和配置
2.裝載JVM.dll
3.初始化JVM.dll並掛界到JNIENV(JNI調用接口)實例
4.調用JNIEnv實例裝載並處理class類。
在我們運行和調試Java程序的時候,經常會提到一個JVM的概念.JVM是Java程序運行的環境,但是他同時一個操作系統的一個應用程序一個進程,因此他也有他自己的運行的生命周期,也有自己的代碼和數據空間.
首先來說一下JVM工作原理中的jdk這個東西,不管你是初學者還是高手,是j2ee程序員還是j2se程序員,jdk總是在幫我們做一些事情.我們在了解Java之前首先大師們會給我們提供說jdk這個東西.它在Java整個體系中充當着什么角色呢?我很驚嘆sun大師們設計天才,能把一個如此完整的體系結構化的如此完美.jdk在這個體系中充當一個生產加工中心,產生所有的數據輸出,是所有指令和戰略的執行中心.本身它提供了Java的完整方案,可以開發目前Java能支持的所有應用和系統程序.這里說一個問題,大家會問,那為什么還有j2me,j2ee這些東西,這兩個東西目的很簡單,分別用來簡化各自領域內的開發和構建過程.jdk除了JVM之外,還有一些核心的API,集成API,用戶工具,開發技術,開發工具和API等組成
好了,廢話說了那么多,來點於主題相關的東西吧.JVM在整個jdk中處於最底層,負責於操作系統的交互,用來屏蔽操作系統環境,提供一個完整的Java運行環境,因此也就虛擬計算機. 操作系統裝入JVM是通過jdk中Java.exe來完成,通過下面4步來完成JVM環境.
1.創建JVM裝載環境和配置
2.裝載JVM.dll
3.初始化JVM.dll並掛界到JNIENV(JNI調用接口)實例
4.調用JNIEnv實例裝載並處理class類。
一.JVM裝入環境,JVM提供的方式是操作系統的動態連接文件.既然是文件那就一個裝入路徑的問題,Java是怎么找這個路徑的呢?當你在調用Java test的時候,操作系統會在path下在你的Java.exe程序,Java.exe就通過下面一個過程來確定JVM的路徑和相關的參數配置了.下面基於Windows的實現的分析.
首先查找jre路徑,Java是通過GetApplicationHome api來獲得當前的Java.exe絕對路徑,c:\j2sdk1.4.2_09\bin\Java.exe,那么它會截取到絕對路徑c:\j2sdk1.4.2_09\,判斷c:\j2sdk1.4.2_09\bin\Java.dll文件是否存在,如果存在就把c:\j2sdk1.4.2_09\作為jre路徑,如果不存在則判斷c:\j2sdk1.4.2_09\jre\bin\Java.dll是否存在,如果存在這c:\j2sdk1.4.2_09\jre作為jre路徑.如果不存在調用GetPublicJREHome查HKEY_LOCAL_MACHINE\Software\JavaSoft\Java Runtime Environment\“當前JRE版本號”\JavaHome的路徑為jre路徑。
然后裝載JVM.cfg文件JRE路徑+\lib+\ARCH(CPU構架)+\JVM.cfgARCH(CPU構架)的判斷是通過Java_md.c中GetArch函數判斷的,該函數中windows平台只有兩種情況:WIN64的‘ia64’,其他情況都為‘i386’。以我的為例:C:\j2sdk1.4.2_09\jre\lib\i386\JVM.cfg.主要的內容如下:
- -client KNOWN
- -server KNOWN
- -hotspot ALIASED_TO -client
- -classic WARN
- -native ERROR
- -green ERROR
在我們的jdk目錄中jre\bin\server和jre\bin\client都有JVM.dll文件存在,而Java正是通過JVM.cfg配置文件來管理這些不同版本的JVM.dll的.通過文件我們可以定義目前jdk中支持那些JVM,前面部分(client)是JVM名稱,后面是參數,KNOWN表示JVM存在,ALIASED_TO表示給別的JVM取一個別名,WARN表示不存在時找一個JVM替代,ERROR表示不存在拋出異常.在運行Java XXX是,Java.exe會通過CheckJVMType來檢查當前的JVM類型,Java可以通過兩種參數的方式來指定具體的JVM類型,一種按照JVM.cfg文件中的JVM名稱指定,第二種方法是直接指定,它們執行的方法分別是“Java -J”、“Java -XXaltJVM=”或“Java -J-XXaltJVM=”。如果是第一種參數傳遞方式,CheckJVMType函數會取參數‘-J’后面的JVM名稱,然后從已知的JVM配置參數中查找如果找到同名的則去掉該JVM名稱前的‘-’直接返回該值;而第二種方法,會直接返回“-XXaltJVM=”或“-J-XXaltJVM=”后面的JVM類型名稱;如果在運行Java時未指定上面兩種方法中的任一一種參數,CheckJVMType會取配置文件中第一個配置中的JVM名稱,去掉名稱前面的‘-’返回該值。CheckJVMType函數的這個返回值會在下面的函數中匯同jre路徑組合成JVM.dll的絕對路徑。如果沒有指定這會使用JVM.cfg中第一個定義的JVM.可以通過set _Java_LAUNCHER_DEBUG=1在控制台上測試.
最后獲得JVM.dll的路徑,JRE路徑+\bin+\JVM類型字符串+\JVM.dll就是JVM的文件路徑了,但是如果在調用Java程序時用-XXaltJVM=參數指定的路徑path,就直接用path+\JVM.dll文件做為JVM.dll的文件路徑.
二:裝載JVM.dll
通過第一步已經找到了JVM的路徑,Java通過LoadJavaVM來裝入JVM.dll文件.裝入工作很簡單就是調用Windows API函數:
LoadLibrary裝載JVM.dll動態連接庫.然后把JVM.dll中的導出函數JNI_CreateJavaVM和JNI_GetDefaultJavaVMInitArgs掛接到InvocationFunctions變量的CreateJavaVM和GetDefaultJavaVMInitArgs函數指針變量上。JVM.dll的裝載工作宣告完成。
三:初始化JVM,獲得本地調用接口,這樣就可以在Java中調用JVM的函數了.調用InvocationFunctions->CreateJavaVM也就是JVM中JNI_CreateJavaVM方法獲得JNIEnv結構的實例.
四:運行Java程序.
Java程序有兩種方式一種是jar包,一種是class. 運行jar,Java -jar XXX.jar運行的時候,Java.exe調用GetMainClassName函數,該函數先獲得JNIEnv實例然后調用Java類Java.util.jar.JarFileJNIEnv中方法getManifest()並從返回的Manifest對象中取getAttributes("Main-Class")的值即jar包中文件:META-INF/MANIFEST.MF指定的Main-Class的主類名作為運行的主類。之后main函數會調用Java.c中LoadClass方法裝載該主類(使用JNIEnv實例的FindClass)。main函數直接調用Java.c中LoadClass方法裝載該類。如果是執行class方法。main函數直接調用Java.c中LoadClass方法裝載該類。
然后main函數調用JNIEnv實例的GetStaticMethodID方法查找裝載的class主類中
“public static void main(String[] args)”方法,並判斷該方法是否為public方法,然后調用JNIEnv實例的
CallStaticVoidMethod方法調用該Java類的main方法。
從Java平台的邏輯結構上來看,我們可以從下圖來了解JVM:
從上圖能清晰看到Java平台包含的各個邏輯模塊,也能了解到JDK與JRE的區別
對於JVM自身的物理結構,我們可以從下圖鳥瞰一下:
對於JVM的學習,在我看來這么幾個部分最重要:
- Java代碼編譯和執行的整個過程
- JVM內存管理及垃圾回收機制
下面將這兩個部分進行詳細學習
Java代碼編譯是由Java源碼編譯器來完成,流程圖如下所示:
Java字節碼的執行是由JVM執行引擎來完成,流程圖如下所示:
Java代碼編譯和執行的整個過程包含了以下三個重要的機制:
- Java源碼編譯機制
- 類加載機制
- 類執行機制
Java源碼編譯機制
Java 源碼編譯由以下三個過程組成:
- 分析和輸入到符號表
- 注解處理
- 語義分析和生成class文件
流程圖如下所示:
最后生成的class文件由以下部分組成:
- 結構信息。包括class文件格式版本號及各部分的數量與大小的信息
- 元數據。對應於Java源碼中聲明與常量的信息。包含類/繼承的超類/實現的接口的聲明信息、域與方法聲明信息和常量池
- 方法信息。對應Java源碼中語句和表達式對應的信息。包含字節碼、異常處理器表、求值棧與局部變量區大小、求值棧的類型記錄、調試符號信息
類加載機制
JVM的類加載是通過ClassLoader及其子類來完成的,類的層次關系和加載順序可以由下圖來描述:
1)Bootstrap ClassLoader
負責加載$JAVA_HOME中jre/lib/rt.jar里所有的class,由C++實現,不是ClassLoader子類
2)Extension ClassLoader
負責加載java平台中擴展功能的一些jar包,包括$JAVA_HOME中jre/lib/*.jar或-Djava.ext.dirs指定目錄下的jar包
3)App ClassLoader
負責記載classpath中指定的jar包及目錄中class
4)Custom ClassLoader
屬於應用程序根據自身需要自定義的ClassLoader,如tomcat、jboss都會根據j2ee規范自行實現ClassLoader
加載過程中會先檢查類是否被已加載,檢查順序是自底向上,從Custom ClassLoader到BootStrap ClassLoader逐層檢查,只要某個classloader已加載就視為已加載此類,保證此類只所有ClassLoader加載一次。而加載的順序是自頂向下,也就是由上層來逐層嘗試加載此類。
類執行機制
JVM是基於棧的體系結構來執行class字節碼的。線程創建后,都會產生程序計數器(PC)和棧(Stack),程序計數器存放下一條要執行的指令在方法內的偏移量,棧中存放一個個棧幀,每個棧幀對應着每個方法的每次調用,而棧幀又是有局部變量區和操作數棧兩部分組成,局部變量區用於存放方法中的局部變量和參數,操作數棧中用於存放方法執行過程中產生的中間結果。棧的結構如下圖所示:
JVM內存組成結構
JVM棧由堆、棧、本地方法棧、方法區等部分組成,結構圖如下所示:
1)堆
所有通過new創建的對象的內存都在堆中分配,其大小可以通過-Xmx和-Xms來控制。堆被划分為新生代和舊生代,新生代又被進一步划分為Eden和Survivor區,最后Survivor由From Space和To Space組成,結構圖如下所示:
- 新生代。新建的對象都是用新生代分配內存,Eden空間不足的時候,會把存活的對象轉移到Survivor中,新生代大小可以由-Xmn來控制,也可以用-XX:SurvivorRatio來控制Eden和Survivor的比例
- 舊生代。用於存放新生代中經過多次垃圾回收仍然存活的對象
2)棧
每個線程執行每個方法的時候都會在棧中申請一個棧幀,每個棧幀包括局部變量區和操作數棧,用於存放此次方法調用過程中的臨時變量、參數和中間結果
3)本地方法棧
用於支持native方法的執行,存儲了每個native方法調用的狀態
4)方法區
存放了要加載的類信息、靜態變量、final類型的常量、屬性和方法信息。JVM用持久代(Permanet Generation)來存放方法區,可通過-XX:PermSize和-XX:MaxPermSize來指定最小值和最大值
垃圾回收機制
JVM分別對新生代和舊生代采用不同的垃圾回收機制
新生代的GC:
新生代通常存活時間較短,因此基於Copying算法來進行回收,所謂Copying算法就是掃描出存活的對象,並復制到一塊新的完全未使用的空間中,對應於新生代,就是在Eden和From Space或To Space之間copy。新生代采用空閑指針的方式來控制GC觸發,指針保持最后一個分配的對象在新生代區間的位置,當有新的對象要分配內存時,用於檢查空間是否足夠,不夠就觸發GC。當連續分配對象時,對象會逐漸從eden到survivor,最后到舊生代,
用java visualVM來查看,能明顯觀察到新生代滿了后,會把對象轉移到舊生代,然后清空繼續裝載,當舊生代也滿了后,就會報outofmemory的異常,如下圖所示:
在執行機制上JVM提供了串行GC(Serial GC)、並行回收GC(Parallel Scavenge)和並行GC(ParNew)
1)串行GC
在整個掃描和復制過程采用單線程的方式來進行,適用於單CPU、新生代空間較小及對暫停時間要求不是非常高的應用上,是client級別默認的GC方式,可以通過-XX:+UseSerialGC來強制指定
2)並行回收GC
在整個掃描和復制過程采用多線程的方式來進行,適用於多CPU、對暫停時間要求較短的應用上,是server級別默認采用的GC方式,可用-XX:+UseParallelGC來強制指定,用-XX:ParallelGCThreads=4來指定線程數
3)並行GC
與舊生代的並發GC配合使用
舊生代的GC:
舊生代與新生代不同,對象存活的時間比較長,比較穩定,因此采用標記(Mark)算法來進行回收,所謂標記就是掃描出存活的對象,然后再進行回收未被標記的對象,回收后對用空出的空間要么進行合並,要么標記出來便於下次進行分配,總之就是要減少內存碎片帶來的效率損耗。在執行機制上JVM提供了串行GC(Serial MSC)、並行GC(parallel MSC)和並發GC(CMS),具體算法細節還有待進一步深入研究。
以上各種GC機制是需要組合使用的,指定方式由下表所示:
指定方式 |
新生代GC方式 |
舊生代GC方式 |
-XX:+UseSerialGC |
串行GC |
串行GC |
-XX:+UseParallelGC |
並行回收GC |
並行GC |
-XX:+UseConeMarkSweepGC |
並行GC |
並發GC |
-XX:+UseParNewGC |
並行GC |
串行GC |
-XX:+UseParallelOldGC |
並行回收GC |
並行GC |
-XX:+ UseConeMarkSweepGC -XX:+UseParNewGC |
串行GC |
並發GC |
不支持的組合 |
1、-XX:+UseParNewGC -XX:+UseParallelOldGC 2、-XX:+UseParNewGC -XX:+UseSerialGC |
內存調優
首先需要注意的是在對JVM內存調優的時候不能只看操作系統級別Java進程所占用的內存,這個數值不能准確的反應堆內存的真實占用情況,因為GC過后這個值是不會變化的,因此內存調優的時候要更多地使用JDK提供的內存查看工具,比如JConsole和Java VisualVM。
對JVM內存的系統級的調優主要的目的是減少GC的頻率和Full GC的次數,過多的GC和Full GC是會占用很多的系統資源(主要是CPU),影響系統的吞吐量。特別要關注Full GC,因為它會對整個堆進行整理,導致Full GC一般由於以下幾種情況:
- 舊生代空間不足
調優時盡量讓對象在新生代GC時被回收、讓對象在新生代多存活一段時間和不要創建過大的對象及數組避免直接在舊生代創建對象 - Pemanet Generation空間不足
增大Perm Gen空間,避免太多靜態對象 - 統計得到的GC后晉升到舊生代的平均大小大於舊生代剩余空間
控制好新生代和舊生代的比例 - System.gc()被顯示調用
垃圾回收不要手動觸發,盡量依靠JVM自身的機制
調優手段主要是通過控制堆內存的各個部分的比例和GC策略來實現,下面來看看各部分比例不良設置會導致什么后果
1)新生代設置過小
一是新生代GC次數非常頻繁,增大系統消耗;二是導致大對象直接進入舊生代,占據了舊生代剩余空間,誘發Full GC
2)新生代設置過大
一是新生代設置過大會導致舊生代過小(堆總量一定),從而誘發Full GC;二是新生代GC耗時大幅度增加
一般說來新生代占整個堆1/3比較合適
3)Survivor設置過小
導致對象從eden直接到達舊生代,降低了在新生代的存活時間
4)Survivor設置過大
導致eden過小,增加了GC頻率
另外,通過-XX:MaxTenuringThreshold=n來控制新生代存活時間,盡量讓對象在新生代被回收
由上述可知新生代和舊生代都有多種GC策略和組合搭配,選擇這些策略對於我們這些開發人員是個難題,JVM提供兩種較為簡單的GC策略的設置方式
1)吞吐量優先
JVM以吞吐量為指標,自行選擇相應的GC策略及控制新生代與舊生代的大小比例,來達到吞吐量指標。這個值可由-XX:GCTimeRatio=n來設置
2)暫停時間優先
JVM以暫停時間為指標,自行選擇相應的GC策略及控制新生代與舊生代的大小比例,盡量保證每次GC造成的應用停止時間都在指定的數值范圍內完成。這個值可由-XX:MaxGCPauseRatio=n來設置
最后匯總一下JVM常見配置
- 堆設置
- -Xms:初始堆大小
- -Xmx:最大堆大小
- -XX:NewSize=n:設置年輕代大小
- -XX:NewRatio=n:設置年輕代和年老代的比值。如:為3,表示年輕代與年老代比值為1:3,年輕代占整個年輕代年老代和的1/4
- -XX:SurvivorRatio=n:年輕代中Eden區與兩個Survivor區的比值。注意Survivor區有兩個。如:3,表示Eden:Survivor=3:2,一個Survivor區占整個年輕代的1/5
- -XX:MaxPermSize=n:設置持久代大小
- 收集器設置
- -XX:+UseSerialGC:設置串行收集器
- -XX:+UseParallelGC:設置並行收集器
- -XX:+UseParalledlOldGC:設置並行年老代收集器
- -XX:+UseConcMarkSweepGC:設置並發收集器
- 垃圾回收統計信息
- -XX:+PrintGC
- -XX:+PrintGCDetails
- -XX:+PrintGCTimeStamps
- -Xloggc:filename
- 並行收集器設置
- -XX:ParallelGCThreads=n:設置並行收集器收集時使用的CPU數。並行收集線程數。
- -XX:MaxGCPauseMillis=n:設置並行收集最大暫停時間
- -XX:GCTimeRatio=n:設置垃圾回收時間占程序運行時間的百分比。公式為1/(1+n)
- 並發收集器設置
- -XX:+CMSIncrementalMode:設置為增量模式。適用於單CPU情況。
- -XX:ParallelGCThreads=n:設置並發收集器年輕代收集方式為並行收集時,使用的CPU數。並行收集線程數。
附:
本系列學習資料主要來自博文http://rednaxelafx.javaeye.com/blog/656951里提到的PPT和《分布式Java應用》里有關JVM的章節,推薦大家繼續深入學習