JVM總結(六):早期(編譯期)優化


這節我們來總結一下JVM編譯器優化問題。 

JVM編譯器優化

JVM的編譯器可以分為三個編譯器: 
1、前端編譯器:把.java轉變為.class的過程。如Sun的Javac、Eclipse JDT中的增量式編譯器(ECJ)。 
2、JIT編譯器:把字節碼轉變為機器碼的過程,如HotSpot VM的C1、C2編譯器。 
3、AOT編譯器:靜態提前編譯器,直接將*.java文件編譯本地機器代碼的過程。

Javac編譯器

  Javac編譯器本身是由Java語言編寫的程序。

Javac的源碼和調試

  javac的源碼存放在JDK_SRC_HOME/langtools/src/share/slasses/com/sun/tools/javac中。 
  編譯過程大致可以分為3個過程: 
    1、解析與填充符號表過程。 
    2、插入式注解處理器的注解處理過程。 
    3、分析與字節碼生成過程。
 
  這3個步驟之間的關系與交互順序如下: 

解析與填充符號表

  解析步驟由parseFiles()方法完成,解析步驟包括了詞法分析和語法分析兩個過程。

  • 詞法分析與語法分析 
    詞法分析:將源代碼的字符流轉變為標記(Token)集合,單個字符是程序編寫過程的最小元素,而標記則是編譯過程的最小元素,關鍵字、變量名、字面量、運算符都可以成為標記,在Javac的源碼中,詞法分析過程由com.sun.tools.javac.parser.Scanner類來實現。 
    語法分析是根據Token序列構造抽象語法樹的過程,抽象語法樹是一種用來描述程序代碼語法結構樹形表述方式。語法樹的每一個節點都代表着程序代碼中的一個語法結構,例如包、類型、修飾符、接口、返回值甚至代碼注釋都可以是一個語法結構。語法分析過程由com.sun.tools.javac.parser.Parser類實現,這個階段產出的抽象語法樹由com.sun.tools.javac.tree.JCTree類表示,經過這個步驟之后,編譯器就基本不會再對源碼文件進行操作了,后續的操作都是建立在抽象語法樹之上的。
  • 填充符號表 
    完成抽象語法樹之后,下一步就是填充符號表的過程,即enterTrees()方法。符號表是由一組符號地址和符號信息構成的表格,類似於哈希表中K-V值對的形式。符號表中所登記的信息在編譯的不同階段都要用到。當對符號名進行地址分配時,符號表是地址分配的依據。填充過程由com.sun.tools.javac.comp.Enter類實現。

注解處理器

  JDK1.5之后,Java提供了對注解的支持,這些注解與普通的Java代碼一樣,在運行期間發揮作用。 
  有了編譯器注解處理的標准API后,我們的代碼才有可能干涉編譯器的行為,由於語法樹中的任意元素,甚至包括代碼注釋都可以在插件之中訪問到,所以使用插入式注解處理器在功能上有很大的發揮空間。

語法分析與字節碼生成

  語法分析之后,編譯器獲得了程序代碼的抽象語法樹表示,語法樹能表示一個結構正確的源代碼抽象。而語義分析的主要任務是對結構上正確的源程序進行上下文有關性質的審查,如進行類型審查。 
  在Javac編譯過程中,語法分析過程分為標注檢查以及數據及控制流分析兩個步驟,分別對應着attribute()和flow()方法完成。

  • 標注檢查 
    標注檢查步驟檢查的內容包括諸如:變量使用前是否已被聲明、變量與賦值之間的數據類型是否能夠匹配等。此外,這個過程中還有一個重要的步驟稱為常量折疊。 
    標注檢查步驟在Javac源碼中的實現類是com.xun.tools.javac.comp.Attr和com.sun.tools.javac.comp.Check類。
  • 數據及控制流分析 
    數據及控制流分析是對程序上下文邏輯更進一步的驗證,它可以查出諸如程序員局部變量在使用前是否有賦值、方法的每條路徑是否都有返回值、是否所有的受查異常都被正確處理了等問題。編譯期的數據及控制流分析與類加載時的數據及數據流分析的目的基本上是一致的,但校驗范圍有所區別,有一些校驗項只有在編譯期或者運行期才能進行。如將局部變量聲明為final,對運行期是沒有影響的,變量的不變性僅僅由編譯器在編譯期間保障,在Javac的源碼中,數據及控制流分析的入口是flow()方法,具體操作由com.sun.tools.javac.comp.Flow類來完成。
  • 解語法糖 
    語法糖是指在計算機語言中添加某種語法,這種語法對語言的功能並沒有影響,但是更方便程序員使用。 
    Java是一種“低糖語言”,常用的語法糖主要是之前提到的泛型、變長參數、自動裝箱/拆箱等。虛擬機運行時不支持這些語法,它們在編譯期還原回簡單的基礎語法結構,這個過程稱為解語法糖。解語法糖的過程是由desuger()方法觸發的。
  • 字節碼生成 
    字節碼生成是Javac編譯過程的最后一個階段,由com.sun.tools.javac.jvm,Gen類來完成,字節碼生成階段不僅僅是把前面各個步驟所生成的信息(語法樹、符號表)轉化為字節碼寫入磁盤中,編譯器還進行了少量代碼添加和轉換工作。 
    完成對語法樹的遍歷與調整之后,就會把填充了所有所需信息的符號表交給com.sun.tools.javac.jvm.ClassWriter類,由這個類的wrtieClass()方法輸出字節碼,生成最終的Class文件。

Java語法糖

泛型和類型擦除

  泛型是JDK1.5新增的特性,它的本質是參數化類型的應用,也就是說所操作的數據類型被指定為一個參數,這種參數類型可以用於類、接口和方法的創建中,分別稱為泛型類、泛型接口和泛型方法。 
  與C#的泛型不一樣的是,Java的泛型只存在於程序源碼中,在編譯后的字節碼文件中,就已經替換成原來的原生類型,也稱為裸類型,並且在相應的地方插入了強制轉型代碼。因此,對於運行期的Java語言來說,ArrayList與ArrayList就是同一個類,所以泛型技術實際上是Java語言的一顆語法糖,Java語言中的泛型實現方法稱為類型擦除,基於這種方法實現的泛型稱為偽泛型。故當List和List作為參數時,擦除使得兩者的特征簽名變得一模一樣,有時可能導致擁有該兩個方法參數的方法無法重載。值得注意的是:當出現上述的情況的時候,如果返回值不一樣的話,該兩個方法是可以存在於一個Class文件中的,總結一下,兩個方法如果有相同的名稱和特征簽名,但返回值不同,那它們也是合法地,可以共存於一個Class文件中。 
  擦除法所謂的擦除,僅僅是對方的Code屬性中的字節碼進行擦除,實際上元數據中還是保留了泛型信息,這也是我們能通過反射手段取得參數化類型的根本依據。

自動裝箱、拆箱與遍歷循環

  自動裝箱、拆箱在編譯之后就被轉換成了相應的包裝和還原方法,如Integer.valueOf()與Integer,intValue()方法,而遍歷循環則把代碼還原成了迭代器的實現,這也是為何遍歷循環需要被遍歷類實現Iterable接口的原因。 
  包裝類的“==”運算在不遇到算術運算的情況下不會自動拆箱,以及它們equals()方法不處理數據轉型的關系。

條件編譯

  Java語言使用條件為常量的if語句,此代碼中的if語句不同於其他Java代碼,它在編譯階段就會被運行,生成的字節碼之中只包含條件正確的部分。 
  Java語言中條件編譯的實現,也是Java語言的一顆語法糖,根據布爾常量值的真假,編譯器將會把分支中不成立的代碼塊消除掉,這是在解語法糖階段實現的。

  Java語言中還有不少的其他語言糖,如內部類、枚舉類、斷言語句、對枚舉和字符串的switch支持、try語句中定義和關閉資源等等。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM