前言
我們平時編碼過程中,可能很少去查看 Java 文件編譯后的字節碼指令。但是,不管你是因為對技術非常熱愛,喜歡刨根問底,還是想在別人面前裝X 。我認為,都非常有必要了解一下常見的字節碼指令。這對於我們理解代碼的運行原理也會很有幫助。
注釋會被執行嗎?
比如,最近我就看到了二哥(沉默王二)的一篇文章,非常有意思,也讓我漲了見識了。且看代碼,可能會讓你懷疑人生~
public class TestAnno {
public static void main(String[] args) {
String str = "張三";
// \u000d str="李四";
System.out.println(str);
}
}
可以猜一下最終打印結果是什么。我來告訴你,結果是: “李四”。What? 這是什么神仙操作。為何會這樣,這被注釋的代碼還能執行?
別光顧着吃驚,我們來看一下為什么打印結果跟我們想象中的略有偏差。
仔細查看,發現注釋行中,有一個 \u000d 。這是一個 unicode 碼,它代表的是一個換行符。因此,在執行后,就會把 str="李四"
這行代碼換行到下一行,從而導致了它也被編譯執行。
有的小伙伴就說了,我怎么知道你說的是真是假呢,你這不是瞎說呢嗎,一點說服力都沒有啊。
好吧,這就需要我們看一下編譯后的字節碼了,編譯器總不能騙我們吧。
查看字節碼的兩種方式
我們知道,通過 javac 命令,可以把 java 文件編譯成 class 文件。然后,想看它的字節碼指令,需要用到 javap -c 反編譯一下。
但是,每次都通過命令行,還是有一些麻煩。因此,懶人福利來了。這里我提供兩種方式,直接在 idea 中就可以查看,非常的方便(果然,懶惰才是促使科技進步的原動力啊)。
配置 External Tools
這種方式,其實就是先配置一下,JDK 中 javap 命令的位置,然后讓 idea 幫我們自動執行 javap 命令。
找到 idea 的菜單欄,File --> Settings 。然后找到 External Tools 。
點擊加號,添加一個 tool ,里邊的配置項,如下,
- Name,就給當前 tool 起一個名字好了,用於使用時,在右鍵菜單選項中展示。
- Decriptions,描述此功能,別到時候你自己都忘了當前配置這個東西是用來干嘛的了。
- Program:電腦本機 javap 命令的絕對路徑。
- Arguments:填寫 -c $FileNameWithoutExtension$.class 就可以,代表編譯的class文件。
- Working directory:填寫 $OutputPath$/$FileDirRelativeToSourcepath$ ,代表class文件的工作目錄。
配置完成了,可以在idea中,直接右鍵,選擇配置中 Name 對應的選項。
此時 ,就可以打印出當前類編譯后的字節碼指令。
我們稍后再來分析里邊的具體含義。下邊,還有另外一種使用插件的方式,來查看字節碼。而且功能更加強大。
jclasslib bytecode viewer 插件
同上,在 idea 的 setting 菜單,找到 Plugins 插件項,然后搜索這個插件。
安裝之后,並重啟 idea ,就可以生效了。
使用的時候,在 View 菜單,找到 show bytecode with jclasslib。
它可以查看基本信息,常量池,接口,屬性,方法等信息。如下,找到我們對應的 main 方法。
這個插件還有一個好處,就是當我們不知道某個指令是什么意思的時候,直接鼠標在指令上邊單擊,就可以鏈接到官方的解釋。如,不知道第一行 ldc 什么意思,直接單擊 ldc 就可以跳轉到 oracle 官網對應命令的解釋。這非常有利用我們學習此命令。
常用字節碼指令
以上兩種方式,都挺方便的,根據自己喜好自由選擇就好了。
相信你肯定也被很多字節碼指令搞的一頭霧水過,接下來,我們就一起學習下常用的指令都有哪些吧。之后,再來看上邊的例子就輕松很多了。
數據類型
我們知道 Java 是強類型語言,在使用之前肯定已經確定了它的類型。而數據類型,無非就是基本數據類型和引用類型。它們對應的字節碼,其實就是用它們的對應類型的英文首字母來表示的。(引用類型除外)
例如,s 代表 short , i 代表 int, l 代表 long ,f 代表 float,d 代表 double,b 代表 byte(不包括boolean),c 代表 char,a 代表 reference 引用。
加載和存儲指令
我們知道,一個方法的運行,會在棧的棧幀中執行。方法中的變量稱為局部變量,數的操作需要用到操作數棧。因此,加載和存儲指令,就是數據在局部變量表和操作數棧中來回傳輸。
將一個局部變量加載到操作數棧:如 iload、iload_ 。表示加載的是 int 類型變量。
iload_ 后邊帶數字代表第幾個 int 型變量。例如 iload_0 代表把第一個 int 型局部變量加載到操作數棧。
其他類型變量同上: lload ,fload ,dload,aload 。
將一個數值存儲到局部變量表: istore,istore_,lstore,lstore_,fstore,fstore_,dstore,dstore_,astore,astore_ 。
將一個常量加載到操作數棧: aconst_null,iconst_m1,iconst_,lconst_,fconst_,dconst_ ,bipush,sipush。
ldc 代表把 int、float、String類型常量從常量池中加載到操作數棧。 ldc_w 代表寬索引。
ldc2_w 代表把 long 或 double 類型常量從常量池中加載到操作數棧。(寬索引)
這里需要說的是,int 類型根據數值的取值范圍不同,而采用不同的字節碼指令。
iconst_m1 代表 -1 ,iconst_ 代表 0~5 。bipush 代表 -128~127(byte取值范圍), sipush 代表 -32768~32767(short取值范圍),ldc 在 int 中代表 -2147483648~2147483647(int取值范圍)。
public class TestByteCode {
public static void main(String[] args) {
int a = -1;
int b = 0;
int c = 1;
int d = 2;
int e = 3;
int f = 4;
int g = 5;
int h = 127;
int i = 32767;
int j = 2147483647;
}
}
其字節碼為:
0 iconst_m1
1 istore_1
2 iconst_0
3 istore_2
4 iconst_1
5 istore_3
6 iconst_2
7 istore 4
9 iconst_3
10 istore 5
12 iconst_4
13 istore 6
15 iconst_5
16 istore 7
18 bipush 127
20 istore 8
22 sipush 32767
25 istore 9
27 ldc #2 <2147483647>
29 istore 10
31 return
訪問指令
訪問類字段:getstatic,putstatic
訪問類實例字段:getfield,putfield
方法調用和返回
- invokevirtual : 用於調用對象的實例方法。
- invokeinterfce: 用於調用接口方法。
- invokespecial:用於調用一些特殊的方法,如父類構造方法,實例初始化方法,私有方法。
- invokestatic:用於調用類的靜態方法。
- invokedynamic:用於調用動態方法。
方法返回是跟返回類型相關,根據不同的返回類型,有不同的指令。
- return:返回 void。
- ireturn:注意,這個不止返回 int ,返回 boolean,byte,char,short 也用這個指令。其實,很多指令都沒有直接支持 byte,char,short和 boolean,而是用 int 類型代替。這是因為,虛擬機的操作碼長度只有一個字節,只能表示有限個數的指令。(我們這里所提到的所有指令,都只是方便我們記憶的助記符,而在計算機內部肯定還是一個字節,即 8 個 bit 位的二進制)
- lreturn:返回 long 類型。
- freturn:返回 float 類型。
- dreturn:返回 double 類型。
- areturn:返回引用類型。
其余字節碼指令
上邊介紹的指令只是很少一部分字節碼指令。但是,麻雀雖小,五臟俱全,也包括了最基本的變量定義,調用方法,和方法返回這些最基本的功能。同時,也足夠我們去解釋上邊的問題,為什么注釋行會被執行了。
更多的字節碼指令可以參考《深入理解Java虛擬機》這本書的 6.4 節,和最后的附錄字節碼指令表。需要這本書的,可以微信搜索到我《煙雨星空》,后台回復“Java虛擬機”。
由於字節碼指令太多,比如還有運算指令,包括加減乘除、位運算,比較指令等,if 等控制指令,類型強轉指令,還有多線程用到的同步鎖。And so on ~
不可能把它們全部記住背會,但是,其實都是由規律可循的,很多都是見名知意,用各種英文首字母簡寫代表。比如,int類型的加法運算,就是 iadd,double 類型的減法運算是 dsub。等等。
因此,我這里只是給了一個引子,重要的還是需要自己去尋找方法,不斷的實踐探索 ~
另外,官方文檔才是最好的學習途徑:https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-6.html
注釋行字節碼
最后,學以致用,實踐出真知。我們一起看一下開頭拋出的問題吧,為什么注釋行會被執行。看一下它的字節碼指令就知道了。
public class TestAnno {
public static void main(String[] args) {
String str = "張三";
// \u000d str="李四";
System.out.println(str);
}
}
//這里就是從常量池中取出一個字符串“張三”,然后加載到操作數棧
0 ldc #2 <張三>
//從操作數棧把這個字符串引用存儲到局部變量表中
2 astore_1
//從常量池中取出一個字符串“李四”,然后加載到操作數棧
3 ldc #3 <李四>
//可以發現和上邊一樣都是astore_1,說明指向的是同一個引用 str。
//若定義另外一個str2賦值給“李四”,這個操作指令肯定就不同了。
5 astore_1
//訪問的是System類的靜態屬性out,我們知道它的類型是PrintStream
6 getstatic #4 <java/lang/System.out>
//將out這個引用加載到操作數棧棧頂,以便后邊操作它
9 aload_1
//調用out的實例方法 println ,用於打印結果到控制台
10 invokevirtual #5 <java/io/PrintStream.println>
//main方法返回值為void
13 return
這里就不用再多余解釋了吧,可以從字節碼指令中看到,后邊的 str="李四"
被編譯器執行了。
如果本文對你有用,就趕快關注我,給我點贊吧~