通過 GraalVM 將 Java 程序編譯成本地機器碼!


前言

2018年4月,Oracle Labs新公開了一項黑科技:Graal VM

這是一個在HotSpot虛擬機基礎上增強而成的跨語言全棧虛擬機,可以作為“任何語言”的運行平台使用。

現在網絡上關於 Graal VM 的相關資料並不多,還是要看官方文檔。本文旨在簡要介紹:

  • 什么是 Graal VM?
  • Graal VM 有什么好處?
  • Graal VM 有什么缺點?
  • Graal VM 的工作原理是什么?
  • 在 macOS 上安裝 Graal VM
  • 將基於 Spring Boot 的 Java 應用程序編譯成本地應用程序

思維導圖

下面是一張 Graal VM 的簡要思維導圖

一篇通俗易懂的文章:GraalVM:微服務時代的Java

什么是 Graal VM

Graal VM 被官方稱為“Universal VM”和“Polyglot VM”,是一個在HotSpot虛擬機基礎上增強而成的跨語言全棧虛擬機,口號是“Run Programs Faster Anywhere”。可以在 Graal VM 上運行“任何語言”,這些語言包括:

  • 基於 Java 虛擬機的語言:Java、Scala、Groovy、Kotlin 等;
  • 基於 LLVM 的語言:C、C++、Rust;
  • 其他語言:JavaScript、Ruby、Python和R語言等。

Graal VM可以無額外開銷地混合使用這些編程語言,支持不同語言中混用對方的接口和對象,也能夠支持這些語言使用已經編寫好的本地庫文件。

Graal VM 的好處

具體可參考官方文檔:Why GraalVM?

我認為最重要的特性是 Ahead-of-Time Compilation。Substrate VM 是一個在 Graal VM 0.20 版本里的極小型的運行時環境,包括了獨立的異常處理、同步調度、線程管理、內存管理(垃圾收集)和JNI訪問等組件。Substrate VM 還包含了一個本地鏡像的構造器(Native Image Generator),用戶可以通過本地鏡像構造器構建基於構建機器的可執行文件。

構造器采用指針分析(Points-To Analysis)技術,從用戶提供的程序入口出發,搜索所有可達的代碼。在搜索的同時,它還將執行初始化代碼,並在最終生成可執行文件時,將已初始化的堆保存至一個堆快照之中。

Substrate VM就可以直接從目標程序開始運行,而無須重復進行Java虛擬機的初始化過程。但相應地,原理上也決定了Substrate VM必須要求目標程序是完全封閉的,即不能動態加載其他編譯期不可知的代碼和類庫。基於這個假設,Substrate VM才能探索整個編譯空間,並通過靜態分析推算出所有虛方法調用的目標方法。

使 Java 適應原生

以往單個服務需要 7*24 小時不間斷運行,需要單機高可用,此時 Java 服務就很適合。但是 Java 應用程序都需要運行在上百兆的 JRE 上,在微服務上就並不合適。

同時在微服務中,應用可以隨時拆分,每個應用並不需要很大的內存,而是需要快速啟動、隨時更新,也可能不需要長時間運行。Java 應用程序本來啟動就很慢,同時需要充分預熱才能夠獲取高性能。

GraalVM 提前編譯就提供了一種解決方案,官方給出使用了 GraalVm 后啟動時間能夠提高 50 倍,內存有 5 倍的下降。

Graal VM 的缺點

Java 語言在微服務天生就有劣勢,這是因為 Java 誕生之初的口號就是“一次編寫,到處運行”。這個口號已經植入 Java 的基因中。如果想改變這些(真的要拿Java的劣勢去和別的語言的優勢相比),會有很多困難:

  • Java 語言的反射機制,使得在編譯期生成可執行文件很困難。因為通過反射機制可以在運行期間動態調用API接口,這些在編譯期是無法感知的。除非放棄反射機制,或者在編譯時提供配置文件供反射調用。
  • ASM、CGLIB、Javassist字節碼庫會在運行時生成、修改字節碼,這些也沒法通過 AOT 編譯成原生代碼。比如 Spring 的依賴注入就使用了 CGLIB 增強。Spring 已經在新版本中適配了 GraalVM,可以關閉 CGLIB。
  • 放棄 HotSpot 虛擬機本身的內部借款,因為在本地鏡像中,連 HotSpot 本身都被消滅了。
  • 啟動時間、內存使用確實有大幅度優化,但是對於長時間運行的大型應用,未必有 HotSpot 的 Java 應用程序速度快。

Graal VM 的工作原理

Graal VM的基本工作原理是將這些語言的源代碼(例如JavaScript)或源代碼編譯后的中間格式(例如LLVM字節碼)通過解釋器轉換為能被Graal VM接受的中間表示(Intermediate Representation,IR),譬如設計一個解釋器專門對LLVM輸出的字節碼進行轉換來支持C和C++語言,這個過程稱為“程序特化”(Specialized,也常稱為Partial Evaluation)。

Graal VM提供了Truffle工具集來快速構建面向一種新語言的解釋器,並用它構建了一個稱為Sulong的高性能LLVM字節碼解釋器。

在 macOS 上安裝 Graal VM

Linux、Windows 等其他平台可以參考 Install GraalVM。由於我使用 macOS,本篇文章介紹如何在 macOS 上安裝 Graal VM,基於 OpenJDK 11 的 GraalVM Community Edition。

安裝 Graal VM

macOS 上的 GraalVM 社區版是 tar.gz 文件,JDK 的安裝目錄是:

/Library/Java/JavaVirtualMachines/<graalvm>/Contents/Home

x86 64位的 macOS 安裝步驟如下:

  1. GraalVM Releases repository on GitHub 上找到 graalvm-ce-java11-darwin-amd64-20.1.0.tar.gz 下載。
  2. 解壓縮
tar -xvf graalvm-ce-java11-darwin-amd64-20.1.0.tar.gz
  1. 將文件夾移動到 /Library/Java/JavaVirtualMachines 目錄下(需要使用 sudo)。
sudo mv graalvm-ce-java11-20.1.0 /Library/Java/JavaVirtualMachines

檢測是否安裝成功,可以運行命令:

/usr/libexec/java_home -V

運行結果為:

Matching Java Virtual Machines (2):
    11.0.7, x86_64:	"GraalVM CE 20.1.0"	/Library/Java/JavaVirtualMachines/graalvm-ce-java11-20.1.0/Contents/Home
    1.8.0_201, x86_64:	"Java SE 8"	/Library/Java/JavaVirtualMachines/jdk1.8.0_201.jdk/Contents/Home

/Library/Java/JavaVirtualMachines/graalvm-ce-java11-20.1.0/Contents/Home
  1. 由於機器上可能存在多個 JDK,需要配置運行環境。

將 GraalVM bin 目錄加入 PATH 環境變量。

export PATH=/Library/Java/JavaVirtualMachines/graalvm-ce-java11-20.1.0/Contents/Home/bin:$PATH

設置 JAVA_HOME 環境變量。

export JAVA_HOME=/Library/Java/JavaVirtualMachines/graalvm-ce-java11-20.1.0/Contents/Home

注意:可能需要修改 bashc 配置文件。

安裝 GraalVM 組件

通過上述步驟,已經安裝好了 GraalVM 的基礎組件,如果需要額外支持 Python、R 等語言,需要使用 gu 組件。

gu install ruby
gu install r
gu install python
gu install wasm

安裝 GraalVM Native Image,運行命令:

gu install native-image

安裝 LLVM toolchain 組件,運行命令:

gu install llvm-toolchain

將基於 Spring Boot 的 Java 應用程序編譯成本地應用程序

可以參考 GitHub 的 spring-boot-graalvm 項目,這個項目里詳細列出了 GraalVM 編譯 Spring Boot Java 應用程序可能出現的所有問題,並對比了 Java 應用啟動與編譯成本地可執行的 Java 程序。

Spring與Graal VM共同維護的在Spring Graal Native項目已經提供了大多數Spring Boot組件的配置信息(以及一些需要在代碼層面處理的Patch),我們只需要簡單依賴該工程即可。這樣 Graal VM 就能獲取編譯期的反射、動態代理等配置。我們只需要簡單依賴工程即可。

需要在 pom.xml 中增加依賴:

<dependency>
    <groupId>org.springframework</groupId>
    <artifactId>spring-context-indexer</artifactId>
    <optional>true</optional>
</dependency>
<dependency>
    <groupId>org.springframework.experimental</groupId>
    <artifactId>spring-graalvm-native</artifactId>
    <version>0.7.1</version>
</dependency>

指定啟動類的路徑:

<properties>
    <start-class>com.yano.workflow.WorkflowApplication</start-class>
</properties>

配置一個獨立的 profile,在編譯時通過 native-image-maven-plugin 插件將其編譯成本地可執行文件。

<profiles>
    <profile>
        <id>native</id>
        <build>
            <plugins>
                <plugin>
                    <groupId>org.graalvm.nativeimage</groupId>
                    <artifactId>native-image-maven-plugin</artifactId>
                    <version>20.1.0</version>
                    <configuration>
                        <buildArgs>-J-Xmx4G -H:+TraceClassInitialization
                            -H:+ReportExceptionStackTraces
                            -Dspring.graal.remove-unused-autoconfig=true
                            -Dspring.graal.remove-yaml-support=true
                        </buildArgs>
                        <imageName>${project.artifactId}</imageName>
                    </configuration>
                    <executions>
                        <execution>
                            <goals>
                                <goal>native-image</goal>
                            </goals>
                            <phase>package</phase>
                        </execution>
                    </executions>
                </plugin>
                <plugin>
                    <groupId>org.springframework.boot</groupId>
                    <artifactId>spring-boot-maven-plugin</artifactId>
                </plugin>
            </plugins>
        </build>
    </profile>
</profiles>

該插件在 Maven 中央倉庫不存在,需要指定 pluginRepositories 和 repositories:

<repositories>
    <repository>
        <id>spring-milestones</id>
        <name>Spring Milestones</name>
        <url>https://repo.spring.io/milestone</url>
    </repository>
</repositories>
<pluginRepositories>
    <pluginRepository>
        <id>spring-milestones</id>
        <name>Spring Milestones</name>
        <url>https://repo.spring.io/milestone</url>
    </pluginRepository>
</pluginRepositories>

Graal VM不支持CGLIB,只能使用JDK動態代理,所以應當把Spring對普通類的Bean增強給關閉掉。Spring Boot 的版本要大於等於 2.2,SpringBootApplication 注解上將 proxyBeanMethods 參數設置為 false。

@SpringBootApplication(proxyBeanMethods = false)
public class SpringBootHelloApplication {

	public static void main(String[] args) {
		SpringApplication.run(SpringBootHelloApplication.class, args);
	}

}

在命令行通過 maven 打包項目:

mvn -Pnative clean package

最終在 target 目錄能夠看到可執行文件,大概在 50M 左右,相比 fat jar 為 17M。

java -jar target/spring-boot-graal-0.0.1-SNAPSHOT.jar

  .   ____          _            __ _ _
 /\\ / ___'_ __ _ _(_)_ __  __ _ \ \ \ \
( ( )\___ | '_ | '_| | '_ \/ _` | \ \ \ \
 \\/  ___)| |_)| | | | | || (_| |  ) ) ) )
  '  |____| .__|_| |_|_| |_\__, | / / / /
 =========|_|==============|___/=/_/_/_/
 :: Spring Boot ::             (v2.3.0.M4)

2020-04-30 15:40:21.187  INFO 40149 --- [           main] i.j.s.SpringBootHelloApplication         : Starting SpringBootHelloApplication v0.0.1-SNAPSHOT on PikeBook.fritz.box with PID 40149 (/Users/jonashecht/dev/spring-boot/spring-boot-graalvm/target/spring-boot-graal-0.0.1-SNAPSHOT.jar started by jonashecht in /Users/jonashecht/dev/spring-boot/spring-boot-graalvm)
2020-04-30 15:40:21.190  INFO 40149 --- [           main] i.j.s.SpringBootHelloApplication         : No active profile set, falling back to default profiles: default
2020-04-30 15:40:22.280  INFO 40149 --- [           main] o.s.b.web.embedded.netty.NettyWebServer  : Netty started on port(s): 8080
2020-04-30 15:40:22.288  INFO 40149 --- [           main] i.j.s.SpringBootHelloApplication         : Started SpringBootHelloApplication in 1.47 seconds (JVM running for 1.924)

能夠通過命令行直接運行程序,啟動速度賊快。對比 Hello World web 普通應用程序,啟動時間是 1.47s,占用內存 491 MB

而編譯成本地代碼的 Spring Boot 程序,啟動速度是 0.078s,占用內存 30 MB

./spring-boot-graal

  .   ____          _            __ _ _
 /\\ / ___'_ __ _ _(_)_ __  __ _ \ \ \ \
( ( )\___ | '_ | '_| | '_ \/ _` | \ \ \ \
 \\/  ___)| |_)| | | | | || (_| |  ) ) ) )
  '  |____| .__|_| |_|_| |_\__, | / / / /
 =========|_|==============|___/=/_/_/_/
 :: Spring Boot ::

2020-05-01 10:25:31.200  INFO 42231 --- [           main] i.j.s.SpringBootHelloApplication         : Starting SpringBootHelloApplication on PikeBook.fritz.box with PID 42231 (/Users/jonashecht/dev/spring-boot/spring-boot-graalvm/target/native-image/spring-boot-graal started by jonashecht in /Users/jonashecht/dev/spring-boot/spring-boot-graalvm/target/native-image)
2020-05-01 10:25:31.200  INFO 42231 --- [           main] i.j.s.SpringBootHelloApplication         : No active profile set, falling back to default profiles: default
2020-05-01 10:25:31.241  WARN 42231 --- [           main] io.netty.channel.DefaultChannelId        : Failed to find the current process ID from ''; using a random value: 635087100
2020-05-01 10:25:31.245  INFO 42231 --- [           main] o.s.b.web.embedded.netty.NettyWebServer  : Netty started on port(s): 8080
2020-05-01 10:25:31.245  INFO 42231 --- [           main] i.j.s.SpringBootHelloApplication         : Started SpringBootHelloApplication in 0.078 seconds (JVM running for 0.08)

總結

  • 本篇文章主要討論 GraalVM 和 Java 的關系,GraalVM 上能夠運行很多語言,可參考Why GraalVM
  • 注意 Graal 的環境變量配置,配置錯誤的話,是沒法編譯的,同時 JDK 11 需要高版本的 maven 版本。
  • Graal VM 和 GraalVM 是一個東東,官網是叫 GraalVM,但是其他地方都是 Graal VM……
  • 為了適應原生,JDK 自身也在演進。
  • GraalVM 編譯的 Java 本地應用僅適用於一次性運行、短時間運行的場景,長時間運行還是傳統 Java 程序效率高。
  • 本篇文章的 GitHub 地址:LjyYano/Thinking_in_Java_MindMapping

公眾號

coding 筆記、點滴記錄,以后的文章也會同步到公眾號(Coding Insight)中,希望大家關注_

代碼和思維導圖在 GitHub 項目中,歡迎大家 star!


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM