現在讓你談談對Java平台的理解,你是否會感覺內容過於龐大?這個問題是比較寬泛的,Java發展到現在已經不僅僅是語言這么簡單了,Java平台涉及的,包括但不僅限於下面提到的這些內容:
- Java語言本身,包括基礎的語言特性,面向對象、放射、范型、lambda等等。
- Java類庫,包括核心類庫如IO/NIO、網絡、utils、安全、jdk等,以及在生產環境中常用的第三方類庫。
- Java虛擬機,包括java的內存管理機制、垃圾收集器、運行時、動態編譯等
- Java/JVM生態,包括了Java EE、Spring、Hadoop、Spark等等
- Java工具,包括用來診斷性能如jmap、jstack等、編譯器javac、sjavac、以及輔助工具如jlink、jar等。
這些內容無法在一個篇幅中都提到。本文從Java等基本特性開始,先來回答一個問題“Java是編譯執行語言,這句話對嗎?”,我們又該如何理解Java的“書寫一次 ,到處執行”呢?
Java語言本身最顯著的兩大特性是“書寫一次,到處運行(Write Once,run anywhere)“,以及垃圾收集。這兩點都和C++有明顯的區別。
”書寫一次,到處運行“的能力是基於Java 虛擬機(JVM)的。Java源代碼編譯后生成的.class文件並不是最終的機器碼,而是一種可以被JVM解析的格式,稱為字節碼。JVM將字節碼翻譯成機器碼后執行機器碼來運行程序。只要在不同的操作系統上安裝好JVM后,.class文件便可以在這些JVM上運行。
從這個過程來看,字節碼是在JVM中被解釋執行的,那么“Java是解釋執行的語言”這句話正確嗎?這句話不太准確,常見的JVM,比如我們最經常使用的Oracle JDK提供的JVM,都提供了JIT(Just-In-Time)編譯器,也就是通常所說的即時編譯(https://en.wikipedia.org/wiki/Just-in-time_compilation)。為了提高熱點代碼的執行效率,在運行時,JVM會把這些代碼編譯成與本地平台相關的機器碼,並進行各種層次的優化,這種情況下,熱點代碼就屬於“編譯執行”而不是解釋執行。JVM提供了不同的參數來對這兩種模式進行指定,例如-Xint
告訴JVM只進行解釋執行,不對代碼進行編譯,這種模式就拋棄了JIT帶來的性能上的優化。同時另一個參數-Xcomp
則是告訴JVM不要進行解釋執行,這種模式也叫做“最大優化級別”,但實際上也並不一定會高效。
總的來說,Java的“編譯”和C/C++的編譯含義是不同的。Java源代碼編譯后生成的.class文件中是字節碼,而不是可以直接運行的機器碼。JVM通過類加載器(class-loader)來加載字節碼,進行解釋執行或編譯執行。除了上面說到的這兩種編譯模式外,還有一種編譯模式稱為AOT(Ahead-of-Time Compilation)(https://en.wikipedia.org/wiki/Ahead-of-time_compilation),AOT可以將字節碼直接編譯成機器碼,在JDK 9中便引入了這些特性。更多的細節可以參考文檔http://openjdk.java.net/jeps/295。
JVM本身是一個強大的平台,它除了使得Java源代碼編譯生成的字節碼具備”書寫一次,到處運行“的能力外,只要符合格式的字節碼,都可以運行在JVM上,所以大量的JVM語言的字節碼都可以在JVM上運行,例如Scala。
關於Java平台的更多內容,請看后續文章。