JVM簡介


一、什么是JVM

  JVM是Java Virtual Machine(Java虛擬機)的縮寫,JVM是一種用於計算設備的規范,它是一個虛構出來的計算機,是通過在實際的計算機上仿真模擬各種計算機功能來實現的。Java虛擬機包括一套字節碼指令集、一組寄存器、一個棧、一個垃圾回收堆和一個存儲方法域。 JVM屏蔽了與具體操作系統平台相關的信息,使Java程序只需生成在Java虛擬機上運行的目標代碼(字節碼),就可以在多種平台上不加修改地運行。JVM在執行字節碼時,實際上最終還是把字節碼解釋成具體平台上的機器指令執行。

  Java語言的一個非常重要的特點就是與平台的無關性。而使用Java虛擬機是實現這一特點的關鍵。一般的高級語言如果要在不同的平台上運行,至少需要編譯成不同的目標代碼。而引入Java語言虛擬機后,Java語言在不同平台上運行時不需要重新編譯。Java語言使用Java虛擬機屏蔽了與具體平台相關的信息,使得Java語言編譯程序只需生成在Java虛擬機上運行的目標代碼(字節碼),就可以在多種平台上不加修改地運行。Java虛擬機在執行字節碼時,把字節碼解釋成具體平台上的機器指令執行。這就是Java的能夠“一次編譯,到處運行”的原因。

二、JVM的組成

我們先把JVM這個虛擬機畫出來,如下圖所示:

從這張圖中我們可以看出,JVM是運行在操作系統之上的,它與硬件沒有直接的交互,我們再來看JVM由哪些部分組成,如下圖所示:

1、Class Loader 類加載器

  類加載器的作用是加載類文件到內存,比如編寫一個HelloWord.java 程序,然后通過javac 編譯成class 文件,那怎么才能加載到內存中被執行呢?Class Loader 承擔的就是這個責任,那不可能隨便建立一個.class 文件就能被加載的,Class Loader 加載的class 文件是有格式要求。

Class Loader 只管加載,只要符合文件結構就加載,至於說能不能運行,則不是它負責的,那是由Execution Engine 負責的。

2、Execution Engine 執行引擎

  執行引擎也叫做解釋器(Interpreter) ,負責解釋命令,提交操作系統執行。

3、Native Interface 本地接口

  本地接口的作用是融合不同的編程語言為Java 所用,它的初衷是融合C/C++ 程序,Java 誕生的時候是C/C++ 橫行的時候,要想立足,必須有一個聰明的、睿智的調用C/C++ 程序,於是就在內存中專門開辟了一塊區域處理標記為native 的代碼,它的具體做法是Native Method Stack 中登記native 方法,在Execution Engine 執行時加載native libraies 。目前該方法使用的是越來越少了,除非是與硬件有關的應用,比如通過Java 程序驅動打印機,或者Java 系統管理生產設備,在企業級應用中已經比較少見,因為現在的異構領域間的通信很發達,比如可以使用Socket 通信,也可以使用Web Service 等等,不多做介紹。

4、 Runtime data area 運行數據區

  運行數據區是整個JVM 的重點。我們所有寫的程序都被加載到這里,之后才開始運行,Java 生態系統如此的繁榮,得益於該區域的優良自治。

整個JVM 框架由加載器加載文件,然后執行器在內存中處理數據,需要與異構系統交互是可以通過本地接口進行,瞧,一個完整的系統誕生了!

三、JVM的內存管理

所有的數據和程序都是在運行數據區存放,它包括以下幾部分:

1、  Stack 棧

棧也叫棧內存,是Java程序的運行區,是在線程創建時創建,它的生命期是跟隨線程的生命期,線程結束棧內存也就釋放,對於棧來說不存在垃圾回收問題,只要線程一結束,該棧就Over。問題出來了:棧中存的是那些數據呢?又什么是格式呢?

棧中的數據都是以棧幀(Stack Frame)的格式存在,棧幀是一個內存區塊,是一個數據集,是一個有關方法(Method)和運行期數據的數據集,當一個方法A被調用時就產生了一個棧幀F1,並被壓入到棧中,A方法又調用了B方法,於是產生棧幀F2也被壓入棧,執行完畢后,先彈出F2棧幀,再彈出F1棧幀,遵循“先進后出”原則。

那棧幀中到底存在着什么數據呢?棧幀中主要保存3類數據:本地變量(Local Variables),包括輸入參數和輸出參數以及方法內的變量;棧操作(Operand Stack),記錄出棧、入棧的操作;棧幀數據(Frame Data),包括類文件、方法等等。光說比較枯燥,我們畫個圖來理解一下Java棧,如下圖所示:


 圖示在一個棧中有兩個棧幀,棧幀2是最先被調用的方法,先入棧,然后方法2又調用了方法1,棧幀1處於棧頂的位置,棧幀2處於棧底,執行完畢后,依次彈出棧幀1和棧幀2,線程結束,棧釋放。

2、Heap 堆內存

 

jvm中分為堆和方法區, 又進一步分為 新生代和老年代, 方法區為永久代。

 堆中區分的新生代和老年代是為了垃圾回收,新生代中的對象存活期一般不長,而老年代中的對象存活期較長,所以當垃圾回收器回收內存時,新生代中垃圾回收效果較好,會回收大量的內存,而老年代中回收效果較差,內存回收不會太多。

 

基於以上特性,新生代中一般采用復制算法,因為存活下來的對象是少數,所需要復制的對象少,而老年代對象存活多,不適合采用復制算法,一般是標記整理和標記清除算法。

 

因為復制算法需要留出一塊單獨的內存空間來以備垃圾回收時復制對象使用,所以將新生代分為eden區和兩個survivor區,每次使用eden和一個survivor區,另一個survivor作為備用的對象復制內存區。

 

 

一個JVM實例只存在一個堆類存,堆內存的大小是可以調節的。類加載器讀取了類文件后,需要把類、方法、常變量放到堆內存中,以方便執行器執行,堆內存分為三部分:

  Permanent Space 永久存儲區

永久存儲區是一個常駐內存區域,用於存放JDK自身所攜帶的Class,Interface的元數據,也就是說它存儲的是運行環境必須的類信息,被裝載進此區域的數據是不會被垃圾回收器回收掉的,關閉JVM才會釋放此區域所占用的內存。

  Young Generation Space 新生區

新生區是類的誕生、成長、消亡的區域,一個類在這里產生,應用,最后被垃圾回收器收集,結束生命。新生區又分為兩部分:伊甸區(Eden space)和幸存者區(Survivor pace),所有的類都是在伊甸區被new出來的。幸存區有兩個: 0區(Survivor 0 space)和1區(Survivor 1 space)。當伊甸園的空間用完時,程序又需要創建對象,JVM的垃圾回收器將對伊甸園區進行垃圾回收,將伊甸園區中的不再被其他對象所引用的對象進行銷毀。然后將伊甸園中的剩余對象移動到幸存0區。若幸存0區也滿了,再對該區進行垃圾回收,然后移動到1區。那如果1區也滿了呢?再移動到養老區。

  Tenure generation space養老區

養老區用於保存從新生區篩選出來的JAVA對象,一般池對象都在這個區域活躍。   三個區的示意圖如下:



 3、 Method Area 方法區

方法區是被所有線程共享,該區域保存所有字段和方法字節碼,以及一些特殊方法如構造函數,接口代碼也在此定義。

4、PC Register 程序計數器

每個線程都有一個程序計數器,就是一個指針,指向方法區中的方法字節碼,由執行引擎讀取下一條指令。

5、Native Method Stack 本地方法棧

四、JVM垃圾回收

 

  GC (Garbage Collection)的基本原理:將內存中不再被使用的對象進行回收,GC中用於回收的方法稱為收集器,由於GC需要消耗一些資源和時間,Java在對對象的生命周期特征進行分析后,按照新生代、舊生代的方式來對對象進行收集,以盡可能的縮短GC對應用造成的暫停

(1)對新生代的對象的收集稱為minor GC;

(2)對舊生代的對象的收集稱為Full GC;

(3)程序中主動調用System.gc()強制執行的GC為Full GC。

不同的對象引用類型, GC會采用不同的方法進行回收,JVM對象的引用分為了四種類型:

(1)強引用:默認情況下,對象采用的均為強引用(這個對象的實例沒有其他對象引用,GC時才會被回收)

(2)軟引用:軟引用是Java中提供的一種比較適合於緩存場景的應用(只有在內存不夠用的情況下才會被GC)

(3)弱引用:在GC時一定會被GC回收

(4)虛引用:由於虛引用只是用來得知對象是否被GC

五、JVM相關問題

問:堆和棧有什么區別

答:堆是存放對象的,但是對象內的臨時變量是存在棧內存中,如例子中的methodVar是在運行期存放到棧中的。

棧是跟隨線程的,有線程就有棧,堆是跟隨JVM的,有JVM就有堆內存。

 

問:堆內存中到底存在着什么東西?

答:對象,包括對象變量以及對象方法。

 

問:類變量和實例變量有什么區別?

答:靜態變量是類變量,非靜態變量是實例變量,直白的說,有static修飾的變量是靜態變量,沒有static修飾的變量是實例變量。靜態變量存在方法區中,實例變量存在堆內存中。

 

問:我聽說類變量是在JVM啟動時就初始化好的,和你這說的不同呀!

答:那你是道聽途說,信我的,沒錯。

 

問:Java的方法(函數)到底是傳值還是傳址?

答:都不是,是以傳值的方式傳遞地址,具體的說原生數據類型傳遞的值,引用類型傳遞的地址。對於原始數據類型,JVM的處理方法是從Method Area或Heap中拷貝到Stack,然后運行frame中的方法,運行完畢后再把變量指拷貝回去。

 

問:為什么會產生OutOfMemory產生?

答:一句話:Heap內存中沒有足夠的可用內存了。這句話要好好理解,不是說Heap沒有內存了,是說新申請內存的對象大於Heap空閑內存,比如現在Heap還空閑1M,但是新申請的內存需要1.1M,於是就會報OutOfMemory了,可能以后的對象申請的內存都只要0.9M,於是就只出現一次OutOfMemory,GC也正常了,看起來像偶發事件,就是這么回事。       但如果此時GC沒有回收就會產生掛起情況,系統不響應了。

 

問:我產生的對象不多呀,為什么還會產生OutOfMemory

答:你繼承層次忒多了,Heap中 產生的對象是先產生 父類,然后才產生子類,明白不?

 

問:OutOfMemory錯誤分幾種?

答:分兩種,分別是“OutOfMemoryError:java heap size”和”OutOfMemoryError: PermGen space”,兩種都是內存溢出,heap size是說申請不到新的內存了,這個很常見,檢查應用或調整堆內存大小。

“PermGen space”是因為永久存儲區滿了,這個也很常見,一般在熱發布的環境中出現,是因為每次發布應用系統都不重啟,久而久之永久存儲區中的死對象太多導致新對象無法申請內存,一般重新啟動一下即可。

 

問:為什么會產生StackOverflowError

答:因為一個線程把Stack內存全部耗盡了,一般是遞歸函數造成的。

 

問:一個機器上可以看多個JVM嗎?JVM之間可以互訪嗎?

答:可以多個JVM,只要機器承受得了。JVM之間是不可以互訪,你不能在A-JVM中訪問B-JVM的Heap內存,這是不可能的。在以前老版本的JVM中,會出現A-JVM Crack后影響到B-JVM,現在版本非常少見。

 

問:為什么Java要采用垃圾回收機制,而不采用C/C++的顯式內存管理?

答:為了簡單,內存管理不是每個程序員都能折騰好的。

 

問:為什么你沒有詳細介紹垃圾回收機制?

答:垃圾回收機制每個JVM都不同,JVM Specification只是定義了要自動釋放內存,也就是說它只定義了垃圾回收的抽象方法,具體怎么實現各個廠商都不同,算法各異,這東西實在沒必要深入。

 

問:JVM中到底哪些區域是共享的?哪些是私有的?

答:Heap和Method Area是共享的,其他都是私有的,

 

問:什么是JIT,你怎么沒說?

答:JIT是指Just In Time,有的文檔把JIT作為JVM的一個部件來介紹,有的是作為執行引擎的一部分來介紹,這都能理解。Java剛誕生的時候是一個解釋性語言,別噓,即使編譯成了字節碼(byte code)也是針對JVM的,它需要再次翻譯成原生代碼(native code)才能被機器執行,於是效率的擔憂就提出來了。Sun為了解決該問題提出了一套新的機制,好,你想編譯成原生代碼,沒問題,我在JVM上提供一個工具,把字節碼編譯成原生碼,下次你來訪問的時候直接訪問原生碼就成了,於是JIT就誕生了,就這么回事。

 

問:JVM還有哪些部分是你沒有提到的?

答:JVM是一個異常復雜的東西,寫一本磚頭書都不為過,還有幾個要說明的:

常量池(constant pool):按照順序存放程序中的常量,並且進行索引編號的區域。比如int i =100,這個100就放在常量池中。

安全管理器(Security Manager):提供Java運行期的安全控制,防止惡意攻擊,比如指定讀取文件,寫入文件權限,網絡訪問,創建進程等等,Class Loader在Security Manager認證通過后才能加載class文件的。

方法索引表(Methods table),記錄的是每個method的地址信息,Stack和Heap中的地址指針其實是指向Methods table地址。

      

問:為什么不建議在程序中顯式的生命System.gc()

答:因為顯式聲明是做堆內存全掃描,也就是Full GC,是需要停止所有的活動的(Stop  The World Collection),你的應用能承受這個嗎?

 

問:JVM有哪些調整參數?

答:非常多,自己去找,堆內存、棧內存的大小都可以定義,甚至是堆內存的三個部分、新生代的各個比例都能調整。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM