Java二进制指令代码解析
Java源码在运行之前都要编译成为字节码格式(如.class文件),然后由ClassLoader将字节码载入运行。在字节码文件中,指令代码只是其中的一部分,里面还记录了字节码文件的编译版本、常量池、访问权限、所有成员变量和成员方法等信息(详见Java字节码格式详解)。本文主要简单介绍不同Java指令的功能以及在代码中如何解析二进制指令。
Java指令是基于栈的体系结构,大部分的指令默认的操作数在栈中。映像中ARM是基于寄存器的操作指令,而x86好像是混合寄存器和存储器的,发现基于栈的操作指令确实简单,学起来很快。不过不知道这种操作的效率怎么样,以我自己的推测应该是不太好的。对这方面不太了解,随便扯几句。
Java总共有200多条指令,不过很多都是重复的。我的理解,网络是Java一个非常重要的特性,而且Java在设计之初就认为字节码是要在网络中传输的,为了减少网络传输流量,字节码就要尽量设计精简、紧凑。因而Java增加了很多重复指令,比如尽量减少操作数,因而我们会发现Java的很多指令都是没有操作数的;并且指令中的操作数基本上都是当无法将值放到栈中的数据,比如局部变量的索引号和常量池中的索引号。
还有一点需要注意的是,在运行过程中,所有boolean、byte、char、short都是以int类型值存在,因而对这些类型的指令操作很少。然而好像sun实现的虚拟机中。这些类型的数组据说不是以int类型的形式保存的,这个很奇怪。我的理解,以字对齐方式的操作效率会比较高,因而做了这种转换,以空间换时间。
Java指令集(按功能分类)
| 常量入栈指令 |
||
| 操作码(助记符) |
操作数 |
描述(栈指操作数栈) |
| aconst_null |
|
null值入栈。 |
| iconst_m1 |
|
-1(int)值入栈。 |
| iconst_0 |
|
0(int)值入栈。 |
| iconst_1 |
|
1(int)值入栈。 |
| iconst_2 |
|
2(int)值入栈。 |
| iconst_3 |
|
3(int)值入栈。 |
| iconst_4 |
|
4(int)值入栈。 |
| iconst_5 |
|
5(int)值入栈。 |
| lconst_0 |
|
0(long)值入栈。 |
| lconst_1 |
|
1(long)值入栈。 |
| fconst_0 |
|
0(float)值入栈。 |
| fconst_1 |
|
1(float)值入栈。 |
| fconst_2 |
|
2(float)值入栈。 |
| dconst_0 |
|
0(double)值入栈。 |
| dconst_1 |
|
1(double)值入栈。 |
| bipush |
valuebyte |
valuebyte值带符号扩展成int值入栈。 |
| sipush |
valuebyte1 valuebyte2 |
(valuebyte1 << 8) | valuebyte2 值带符号扩展成int值入栈。 |
| ldc |
indexbyte1 |
常量池中的常量值(int, float, string reference, object reference)入栈。 |
| ldc_w |
indexbyte1 indexbyte2 |
常量池中常量(int, float, string reference, object reference)入栈。 |
| ldc2_w |
indexbyte1 indexbyte2 |
常量池中常量(long, double)入栈。 |
|
|
||
| 局部变量值转载到栈中指令 |
||
| 操作码(助记符) |
操作数 |
描述(栈指操作数栈) |
| (wide)aload |
indexbyte |
从局部变量indexbyte中装载引用类型值入栈。 |
| aload_0 |
|
从局部变量0中装载引用类型值入栈。 |
| aload_1 |
|
从局部变量1中装载引用类型值入栈。 |
| aload_2 |
|
从局部变量2中装载引用类型值入栈。 |
| aload_3 |
|
从局部变量3中装载引用类型值入栈。 |
| (wide)iload |
indexbyte |
从局部变量indexbyte中装载int类型值入栈。 |
| iload_0 |
|
从局部变量0中装载int类型值入栈。 |
| iload_1 |
|
从局部变量1中装载int类型值入栈。 |
| iload_2 |
|
从局部变量2中装载int类型值入栈。 |
| iload_3 |
|
从局部变量3中装载int类型值入栈。 |
| (wide)lload |
indexbyte |
从局部变量indexbyte中装载long类型值入栈。 |
| lload_0 |
|
从局部变量0中装载int类型值入栈。 |
| lload_1 |
|
从局部变量1中装载int类型值入栈。 |
| lload_2 |
|
从局部变量2中装载int类型值入栈。 |
| lload_3 |
|
从局部变量3中装载int类型值入栈。 |
| (wide)fload |
indexbyte |
从局部变量indexbyte中装载float类型值入栈。 |
| fload_0 |
|
从局部变量0中装载float类型值入栈。 |
| fload_1 |
|
从局部变量1中装载float类型值入栈。 |
| fload_2 |
|
从局部变量2中装载float类型值入栈。 |
| fload_3 |
|
从局部变量3中装载float类型值入栈。 |
| (wide)dload |
indexbyte |
从局部变量indexbyte中装载double类型值入栈。 |
| dload_0 |
|
从局部变量0中装载double类型值入栈。 |
| dload_1 |
|
从局部变量1中装载double类型值入栈。 |
| dload_2 |
|
从局部变量2中装载double类型值入栈。 |
| dload_3 |
|
从局部变量3中装载double类型值入栈。 |
| aaload |
|
从引用类型数组中装载指定项的值。 |
| iaload |
|
从int类型数组中装载指定项的值。 |
| laload |
|
从long类型数组中装载指定项的值。 |
| faload |
|
从float类型数组中装载指定项的值。 |
| daload |
|
从double类型数组中装载指定项的值。 |
| baload |
|
从boolean类型数组或byte类型数组中装载指定项的值(先转换为int类型值,后压栈)。 |
| caload |
|
从char类型数组中装载指定项的值(先转换为int类型值,后压栈)。 |
| saload |
|
从short类型数组中装载指定项的值(先转换为int类型值,后压栈)。 |
|
|
||
| 将栈顶值保存到局部变量中指令 |
||
| 操作码(助记符) |
操作数 |
描述(栈指操作数栈) |
| (wide)astore |
indexbyte |
将栈顶引用类型值保存到局部变量indexbyte中。 |
| astroe_0 |
|
将栈顶引用类型值保存到局部变量0中。 |
| astore_1 |
|
将栈顶引用类型值保存到局部变量1中。 |
| astore_2 |
|
将栈顶引用类型值保存到局部变量2中。 |
| astore_3 |
|
将栈顶引用类型值保存到局部变量3中。 |
| (wide)istore |
indexbyte |
将栈顶int类型值保存到局部变量indexbyte中。 |
| istore_0 |
|
将栈顶int类型值保存到局部变量0中。 |
| istore_1 |
|
将栈顶int类型值保存到局部变量1中。 |
| istore_2 |
|
将栈顶int类型值保存到局部变量2中。 |
| istore_3 |
|
将栈顶int类型值保存到局部变量3中。 |
| (wide)lstore |
indexbyte |
将栈顶long类型值保存到局部变量indexbyte中。 |
| lstore_0 |
|
将栈顶long类型值保存到局部变量0中。 |
| lstore_1 |
|
将栈顶long类型值保存到局部变量1中。 |
| lstore_2 |
|
将栈顶long类型值保存到局部变量2中。 |
| lstroe_3 |
|
将栈顶long类型值保存到局部变量3中。 |
| (wide)fstore |
indexbyte |
将栈顶float类型值保存到局部变量indexbyte中。 |
| fstore_0 |
|
将栈顶float类型值保存到局部变量0中。 |
| fstore_1 |
|
将栈顶float类型值保存到局部变量1中。 |
| fstore_2 |
|
将栈顶float类型值保存到局部变量2中。 |
| fstore_3 |
|
将栈顶float类型值保存到局部变量3中。 |
| (wide)dstore |
indexbyte |
将栈顶double类型值保存到局部变量indexbyte中。 |
| dstore_0 |
|
将栈顶double类型值保存到局部变量0中。 |
| dstore_1 |
|
将栈顶double类型值保存到局部变量1中。 |
| dstore_2 |
|
将栈顶double类型值保存到局部变量2中。 |
| dstore_3 |
|
将栈顶double类型值保存到局部变量3中。 |
| aastore |
|
将栈顶引用类型值保存到指定引用类型数组的指定项。 |
| iastore |
|
将栈顶int类型值保存到指定int类型数组的指定项。 |
| lastore |
|
将栈顶long类型值保存到指定long类型数组的指定项。 |
| fastore |
|
将栈顶float类型值保存到指定float类型数组的指定项。 |
| dastore |
|
将栈顶double类型值保存到指定double类型数组的指定项。 |
| bastroe |
|
将栈顶boolean类型值或byte类型值保存到指定boolean类型数组或byte类型数组的指定项。 |
| castore |
|
将栈顶char类型值保存到指定char类型数组的指定项。 |
| sastore |
|
将栈顶short类型值保存到指定short类型数组的指定项。 |
|
|
||
| wide指令 |
||
| 操作码(助记符) |
操作数 |
描述(栈指操作数栈) |
| wide |
|
使用附加字节扩展局部变量索引(iinc指令特殊)。 |
|
|
||
| 通用(无类型)栈操作指令 |
||
| 操作码(助记符) |
操作数 |
描述(栈指操作数栈) |
| nop |
|
空操作。 |
| pop |
|
从栈顶弹出一个字长的数据。 |
| pop2 |
|
从栈顶弹出两个字长的数据。 |
| dup |
|
复制栈顶一个字长的数据,将复制后的数据压栈。 |
| dup_x1 |
|
复制栈顶一个字长的数据,弹出栈顶两个字长数据,先将复制后的数据压栈,再将弹出的两个字长数据压栈。 |
| dup_x2 |
|
复制栈顶一个字长的数据,弹出栈顶三个字长的数据,将复制后的数据压栈,再将弹出的三个字长的数据压栈。 |
| dup2 |
|
复制栈顶两个字长的数据,将复制后的两个字长的数据压栈。 |
| dup2_x1 |
|
复制栈顶两个字长的数据,弹出栈顶三个字长的数据,将复制后的两个字长的数据压栈,再将弹出的三个字长的数据压栈。 |
| dup2_x2 |
|
复制栈顶两个字长的数据,弹出栈顶四个字长的数据,将复制后的两个字长的数据压栈,再将弹出的四个字长的数据压栈。 |
| swap |
|
交换栈顶两个字长的数据的位置。Java指令中没有提供以两个字长为单位的交换指令。 |
|
|
||
| 类型转换指令 |
||
| 操作码(助记符) |
操作数 |
描述(栈指操作数栈) |
| i2f |
|
将栈顶int类型值转换为float类型值。 |
| i2l |
|
将栈顶int类型值转换为long类型值。 |
| i2d |
|
将栈顶int类型值转换为double类型值。 |
| f2i |
|
将栈顶float类型值转换为int类型值。 |
| f2l |
|
将栈顶float类型值转换为long类型值。 |
| f2d |
|
将栈顶float类型值转换为double类型值。 |
| l2i |
|
将栈顶long类型值转换为int类型值。 |
| l2f |
|
将栈顶long类型值转换为float类型值。 |
| l2d |
|
将栈顶long类型值转换double类型值。 |
| d2i |
|
将栈顶double类型值转换为int类型值。 |
| d2f |
|
将栈顶double类型值转换为float类型值。 |
| d2l |
|
将栈顶double类型值转换为long类型值。 |
| i2b |
|
将栈顶int类型值截断成byte类型,后带符号扩展成int类型值入栈。 |
| i2c |
|
将栈顶int类型值截断成char类型值,后带符号扩展成int类型值入栈。 |
| i2s |
|
将栈顶int类型值截断成short类型值,后带符号扩展成int类型值入栈。 |
|
|
||
| 整数运算 |
||
| 操作码(助记符) |
操作数 |
描述(栈指操作数栈) |
| iadd |
|
将栈顶两int类型数相加,结果入栈。 |
| isub |
|
将栈顶两int类型数相减,结果入栈。 |
| imul |
|
将栈顶两int类型数相乘,结果入栈。 |
| idiv |
|
将栈顶两int类型数相除,结果入栈。 |
| irem |
|
将栈顶两int类型数取模,结果入栈。 |
| ineg |
|
将栈顶int类型值取负,结果入栈。 |
| ladd |
|
将栈顶两long类型数相加,结果入栈。 |
| lsub |
|
将栈顶两long类型数相减,结果入栈。 |
| lmul |
|
将栈顶两long类型数相乘,结果入栈。 |
| ldiv |
|
将栈顶两long类型数相除,结果入栈。 |
| lrem |
|
将栈顶两long类型数取模,结果入栈。 |
| lneg |
|
将栈顶long类型值取负,结果入栈。 |
| (wide)iinc |
indexbyte constbyte |
将整数值constbyte加到indexbyte指定的int类型的局部变量中。 |
|
|
||
| 浮点运算 |
||
| 操作码(助记符) |
操作数 |
描述(栈指操作数栈) |
| fadd |
|
将栈顶两float类型数相加,结果入栈。 |
| fsub |
|
将栈顶两float类型数相减,结果入栈。 |
| fmul |
|
将栈顶两float类型数相乘,结果入栈。 |
| fdiv |
|
将栈顶两float类型数相除,结果入栈。 |
| frem |
|
将栈顶两float类型数取模,结果入栈。 |
| fneg |
|
将栈顶float类型值取反,结果入栈。 |
| dadd |
|
将栈顶两double类型数相加,结果入栈。 |
| dsub |
|
将栈顶两double类型数相减,结果入栈。 |
| dmul |
|
将栈顶两double类型数相乘,结果入栈。 |
| ddiv |
|
将栈顶两double类型数相除,结果入栈。 |
| drem |
|
将栈顶两double类型数取模,结果入栈。 |
| dneg |
|
将栈顶double类型值取负,结果入栈。 |
|
|
||
| 逻辑运算——移位运算 |
||
| 操作码(助记符) |
操作数 |
描述(栈指操作数栈) |
| ishl |
|
左移int类型值。 |
| lshl |
|
左移long类型值。 |
| ishr |
|
算术右移int类型值。 |
| lshr |
|
算术右移long类型值。 |
| iushr |
|
逻辑右移int类型值。 |
| lushr |
|
逻辑右移long类型值。 |
|
|
||
| 逻辑运算——按位布尔运算 |
||
| 操作码(助记符) |
操作数 |
描述(栈指操作数栈) |
| iand |
|
对int类型按位与运算。 |
| land |
|
对long类型的按位与运算。 |
| ior |
|
对int类型的按位或运算。 |
| lor |
|
对long类型的按位或运算。 |
| ixor |
|
对int类型的按位异或运算。 |
| lxor |
|
对long类型的按位异或运算。 |
|
|
||
| 控制流指令——条件跳转指令 |
||
| 操作码(助记符) |
操作数 |
描述(栈指操作数栈) |
| ifeq |
branchbyte1 branchbyte2 |
若栈顶int类型值为0则跳转。 |
| ifne |
branchbyte1 branchbyte2 |
若栈顶int类型值不为0则跳转。 |
| iflt |
branchbyte1 branchbyte2 |
若栈顶int类型值小于0则跳转。 |
| ifle |
branchbyte1 branchbyte2 |
若栈顶int类型值小于等于0则跳转。 |
| ifgt |
branchbyte1 branchbyte2 |
若栈顶int类型值大于0则跳转。 |
| ifge |
branchbyte1 branchbyte2 |
若栈顶int类型值大于等于0则跳转。 |
| if_icmpeq |
branchbyte1 branchbyte2 |
若栈顶两int类型值相等则跳转。 |
| if_icmpne |
branchbyte1 branchbyte2 |
若栈顶两int类型值不相等则跳转。 |
| if_icmplt |
branchbyte1 branchbyte2 |
若栈顶两int类型值前小于后则跳转。 |
| if_icmple |
branchbyte1 branchbyte2 |
若栈顶两int类型值前小于等于后则跳转。 |
| if_icmpgt |
branchbyte1 branchbyte2 |
若栈顶两int类型值前大于后则跳转。 |
| if_icmpge |
branchbyte1 branchbyte2 |
若栈顶两int类型值前大于等于后则跳转。 |
| ifnull |
branchbyte1 branchbyte2 |
若栈顶引用值为null则跳转。 |
| ifnonnull |
branchbyte1 branchbyte2 |
若栈顶引用值不为null则跳转。 |
| if_acmpeq |
branchbyte1 branchbyte2 |
若栈顶两引用类型值相等则跳转。 |
| if_acmpne |
branchbyte1 branchbyte2 |
若栈顶两引用类型值不相等则跳转。 |
|
|
||
| 控制流指令——比较指令 |
||
| 操作码(助记符) |
操作数 |
描述(栈指操作数栈) |
| lcmp |
|
比较栈顶两long类型值,前者大,1入栈;相等,0入栈;后者大,-1入栈。 |
| fcmpl |
|
比较栈顶两float类型值,前者大,1入栈;相等,0入栈;后者大,-1入栈;有NaN存在,-1入栈。 |
| fcmpg |
|
比较栈顶两float类型值,前者大,1入栈;相等,0入栈;后者大,-1入栈;有NaN存在,-1入栈。 |
| dcmpl |
|
比较栈顶两double类型值,前者大,1入栈;相等,0入栈;后者大,-1入栈;有NaN存在,-1入栈。 |
| dcmpg |
|
比较栈顶两double类型值,前者大,1入栈;相等,0入栈;后者大,-1入栈;有NaN存在,-1入栈。 |
|
|
||
| 控制流指令——无条件跳转指令 |
||
| 操作码(助记符) |
操作数 |
描述(栈指操作数栈) |
| goto |
branchbyte1 branchbyte2 |
无条件跳转到指定位置。 |
| goto_w |
branchbyte1 branchbyte2 branchbyte3 branchbyte4 |
无条件跳转到指定位置(宽索引)。 |
|
|
||
| 控制流指令——表跳转指令 |
||
| 操作码(助记符) |
操作数 |
描述(栈指操作数栈) |
| tableswitch |
<0-3bytepad> defaultbyte1 defaultbyte2 defaultbyte3 defaultbyte4 lowbyte1 lowbyte2 lowbyte3 lowbyte4 highbyte1 highbyte2 highbyte3 highbyte4 jump offsets... |
通过索引访问跳转表,并跳转。 |
| lookupswitch |
<0-3bytepad> defaultbyte1 defaultbyte2 defaultbyte3 defaultbyte4 npairs1 npairs2 npairs3 npairs4 match offsets |
通过键值访问跳转表,并跳转。 |
|
|
||
| 控制流指令——异常和finally |
||
| 操作码(助记符) |
操作数 |
描述(栈指操作数栈) |
| athrow |
|
抛出异常。 |
| jsr |
branchbyte1 branchbyte2 |
跳转到子例程序。 |
| jsr_w |
branchbyte1 branchbyte2 branchbyte3 branchbyte4 |
跳转到子例程序(宽索引)。 |
| (wide)ret |
indexbyte |
返回子例程序。 |
|
|
||
| 对象操作指令 |
||
| 操作码(助记符) |
操作数 |
描述(栈指操作数栈) |
| new |
indexbyte1 indexbyte2 |
创建新的对象实例。 |
| checkcast |
indexbyte1 indexbyte |
类型强转。 |
| instanceof |
indexbyte1 indexbyte2 |
判断类型。 |
| getfield |
indexbyte1 indexbyte2 |
获取对象字段的值。 |
| putfield |
indexbyte1 indexbyte2 |
给对象字段赋值。 |
| getstatic |
indexbyte1 indexbyte2 |
获取静态字段的值。 |
| putstatic |
indexbyte1 indexbyte2 |
给静态字段赋值。 |
|
|
||
| 数组操作指令 |
||
| 操作码(助记符) |
操作数 |
描述(栈指操作数栈) |
| newarray |
atype |
创建type类型的数组。 |
| anewarray |
indexbyte1 indexbyte2 |
创建引用类型的数组。 |
| arraylength |
|
获取一维数组的长度。 |
| multianewarray |
indexbyte1 indexbyte2 dimension |
创建dimension维度的数组。 |
|
|
||
| 方法调用指令 |
||
| 操作码(助记符) |
操作数 |
描述(栈指操作数栈) |
| invokespecial |
indexbyte1 indexbyte2 |
编译时方法绑定调用方法。 |
| invokevirtual |
indexbyte1 indexbyte2 |
运行时方法绑定调用方法。 |
| invokestatic |
indexbyte1 indexbyte2 |
调用静态方法。 |
| invokeinterface |
indexbyte1 indexbyte2 count 0 |
调用接口方法。 |
|
|
||
| 方法返回指令 |
||
| 操作码(助记符) |
操作数 |
描述(栈指操作数栈) |
| ireturn |
|
返回int类型值。 |
| lreturn |
|
返回long类型值。 |
| freturn |
|
返回float类型值。 |
| dreturn |
|
返回double类型值。 |
| areturn |
|
返回引用类型值。 |
| return |
|
void函数返回。 |
|
|
||
| 线程同步指令 |
||
| 操作码(助记符) |
操作数 |
描述(栈指操作数栈) |
| monitorenter |
|
进入并获得对象监视器。 |
| monitorexit |
|
释放并退出对象监视器。 |
参考《深入解析JVM》 2010年10月6日
转载自:http://www.blogjava.net/DLevin/archive/2011/09/13/358497.html
