前言

我们平时编码过程中,可能很少去查看 Java 文件编译后的字节码指令。但是,不管你是因为对技术非常热爱,喜欢刨根问底,还是想在别人面前装X 。我认为,都非常有必要了解一下常见的字节码指令。这对于我们理解代码的运行原理也会很有帮助。

注释会被执行吗?

比如,最近我就看到了二哥(沉默王二)的一篇文章,非常有意思,也让我涨了见识了。且看代码,可能会让你怀疑人生~

public class TestAnno {
    public static void main(String[] args) {
        String str = "张三";
        // \u000d str="李四";
        System.out.println(str);
    }
}

可以猜一下最终打印结果是什么。我来告诉你,结果是: “李四”。What? 这是什么神仙操作。为何会这样,这被注释的代码还能执行?

别光顾着吃惊,我们来看一下为什么打印结果跟我们想象中的略有偏差。

仔细查看,发现注释行中,有一个 u000d 。这是一个 unicode 码,它代表的是一个换行符。因此,在执行后,就会把 str="李四" 这行代码换行到下一行,从而导致了它也被编译执行。

有的小伙伴就说了,我怎么知道你说的是真是假呢,你这不是瞎说呢吗,一点说服力都没有啊。

好吧,这就需要我们看一下编译后的字节码了,编译器总不能骗我们吧。

查看字节码的两种方式

我们知道,通过 javac 命令,可以把 java 文件编译成 class 文件。然后,想看它的字节码指令,需要用到 javap -c 反编译一下。

但是,每次都通过命令行,还是有一些麻烦。因此,懒人福利来了。这里我提供两种方式,直接在 idea 中就可以查看,非常的方便(果然,懒惰才是促使科技进步的原动力啊)。

配置 External Tools

这种方式,其实就是先配置一下,JDK 中 javap 命令的位置,然后让 idea 帮我们自动执行 javap 命令。

找到 idea 的菜单栏,File --> Settings 。然后找到 External Tools 。

点击加号,添加一个 tool ,里边的配置项,如下,

  • Name,就给当前 tool 起一个名字好了,用于使用时,在右键菜单选项中展示。
  • Decriptions,描述此功能,别到时候你自己都忘了当前配置这个东西是用来干嘛的了。
  • Program:电脑本机 javap 命令的绝对路径。
  • Arguments:填写 -c $FileNameWithoutExtension$.class 就可以,代表编译的class文件。
  • Working directory:填写 $OutputPath$/$FileDirRelativeToSourcepath$ ,代表class文件的工作目录。

配置完成了,可以在idea中,直接右键,选择配置中 Name 对应的选项。

此时 ,就可以打印出当前类编译后的字节码指令。

我们稍后再来分析里边的具体含义。下边,还有另外一种使用插件的方式,来查看字节码。而且功能更加强大。

jclasslib bytecode viewer 插件

同上,在 idea 的 setting 菜单,找到 Plugins 插件项,然后搜索这个插件。

安装之后,并重启 idea ,就可以生效了。

使用的时候,在 View 菜单,找到 show bytecode with jclasslib。

它可以查看基本信息,常量池,接口,属性,方法等信息。如下,找到我们对应的 main 方法。

这个插件还有一个好处,就是当我们不知道某个指令是什么意思的时候,直接鼠标在指令上边单击,就可以链接到官方的解释。如,不知道第一行 ldc 什么意思,直接单击 ldc 就可以跳转到 oracle 官网对应命令的解释。这非常有利用我们学习此命令。

常用字节码指令

以上两种方式,都挺方便的,根据自己喜好自由选择就好了。

相信你肯定也被很多字节码指令搞的一头雾水过,接下来,我们就一起学习下常用的指令都有哪些吧。之后,再来看上边的例子就轻松很多了。

数据类型

我们知道 Java 是强类型语言,在使用之前肯定已经确定了它的类型。而数据类型,无非就是基本数据类型和引用类型。它们对应的字节码,其实就是用它们的对应类型的英文首字母来表示的。(引用类型除外)

例如,s 代表 short , i 代表 int, l 代表 long ,f 代表 float,d 代表 double,b 代表 byte(不包括boolean),c 代表 char,a 代表 reference 引用。

加载和存储指令

我们知道,一个方法的运行,会在栈的栈帧中执行。方法中的变量称为局部变量,数的操作需要用到操作数栈。因此,加载和存储指令,就是数据在局部变量表和操作数栈中来回传输。

将一个局部变量加载到操作数栈:如 iload、iload_ 。表示加载的是 int 类型变量。

iload_ 后边带数字代表第几个 int 型变量。例如 iload_0 代表把第一个 int 型局部变量加载到操作数栈。

其他类型变量同上: lload ,fload ,dload,aload 。

将一个数值存储到局部变量表: istore,istore_,lstore,lstore_,fstore,fstore_,dstore,dstore_,astore,astore_ 。

将一个常量加载到操作数栈: aconst_null,iconst_m1,iconst_,lconst_,fconst_,dconst_ ,bipush,sipush。

ldc 代表把 int、float、String类型常量从常量池中加载到操作数栈。 ldc_w 代表宽索引。

ldc2_w 代表把 long 或 double 类型常量从常量池中加载到操作数栈。(宽索引)

这里需要说的是,int 类型根据数值的取值范围不同,而采用不同的字节码指令。

iconst_m1 代表 -1 ,iconst_ 代表 0~5 。bipush 代表 -128~127(byte取值范围), sipush 代表 -32768~32767(short取值范围),ldc 在 int 中代表 -2147483648~2147483647(int取值范围)。

public class TestByteCode {
    public static void main(String[] args) {
        int a = -1;
        int b = 0;
        int c = 1;
        int d = 2;
        int e = 3;
        int f = 4;
        int g = 5;
        int h = 127;
        int i = 32767;
        int j = 2147483647;
    }
}

其字节码为:

0 iconst_m1
 1 istore_1
 2 iconst_0
 3 istore_2
 4 iconst_1
 5 istore_3
 6 iconst_2
 7 istore 4
 9 iconst_3
10 istore 5
12 iconst_4
13 istore 6
15 iconst_5
16 istore 7
18 bipush 127
20 istore 8
22 sipush 32767
25 istore 9
27 ldc #2 <2147483647>
29 istore 10
31 return

访问指令

访问类字段:getstatic,putstatic

访问类实例字段:getfield,putfield

方法调用和返回

  • invokevirtual : 用于调用对象的实例方法。
  • invokeinterfce: 用于调用接口方法。
  • invokespecial:用于调用一些特殊的方法,如父类构造方法,实例初始化方法,私有方法。
  • invokestatic:用于调用类的静态方法。
  • invokedynamic:用于调用动态方法。

方法返回是跟返回类型相关,根据不同的返回类型,有不同的指令。

  • return:返回 void。
  • ireturn:注意,这个不止返回 int ,返回 boolean,byte,char,short 也用这个指令。其实,很多指令都没有直接支持 byte,char,short和 boolean,而是用 int 类型代替。这是因为,虚拟机的操作码长度只有一个字节,只能表示有限个数的指令。(我们这里所提到的所有指令,都只是方便我们记忆的助记符,而在计算机内部肯定还是一个字节,即 8 个 bit 位的二进制)
  • lreturn:返回 long 类型。
  • freturn:返回 float 类型。
  • dreturn:返回 double 类型。
  • areturn:返回引用类型。

其余字节码指令

上边介绍的指令只是很少一部分字节码指令。但是,麻雀虽小,五脏俱全,也包括了最基本的变量定义,调用方法,和方法返回这些最基本的功能。同时,也足够我们去解释上边的问题,为什么注释行会被执行了。

更多的字节码指令可以参考《深入理解Java虚拟机》这本书的 6.4 节,和最后的附录字节码指令表。需要这本书的,可以微信搜索到我《烟雨星空》,后台回复“Java虚拟机”。

由于字节码指令太多,比如还有运算指令,包括加减乘除、位运算,比较指令等,if 等控制指令,类型强转指令,还有多线程用到的同步锁。And so on ~

不可能把它们全部记住背会,但是,其实都是由规律可循的,很多都是见名知意,用各种英文首字母简写代表。比如,int类型的加法运算,就是 iadd,double 类型的减法运算是 dsub。等等。

因此,我这里只是给了一个引子,重要的还是需要自己去寻找方法,不断的实践探索 ~

另外,官方文档才是最好的学习途径:https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-6.html

注释行字节码

最后,学以致用,实践出真知。我们一起看一下开头抛出的问题吧,为什么注释行会被执行。看一下它的字节码指令就知道了。

public class TestAnno {
    public static void main(String[] args) {
        String str = "张三";
        // \u000d str="李四";
        System.out.println(str);
    }
}
 //这里就是从常量池中取出一个字符串“张三”,然后加载到操作数栈
 0 ldc #2 <张三>
 //从操作数栈把这个字符串引用存储到局部变量表中
 2 astore_1
 //从常量池中取出一个字符串“李四”,然后加载到操作数栈
 3 ldc #3 <李四>
 //可以发现和上边一样都是astore_1,说明指向的是同一个引用 str。
 //若定义另外一个str2赋值给“李四”,这个操作指令肯定就不同了。
 5 astore_1
 //访问的是System类的静态属性out,我们知道它的类型是PrintStream
 6 getstatic #4 <java/lang/System.out>
 //将out这个引用加载到操作数栈栈顶,以便后边操作它
 9 aload_1
 //调用out的实例方法 println ,用于打印结果到控制台
10 invokevirtual #5 <java/io/PrintStream.println>
//main方法返回值为void
13 return

这里就不用再多余解释了吧,可以从字节码指令中看到,后边的 str="李四" 被编译器执行了。

如果本文对你有用,就赶快关注我,给我点赞吧~


烟雨星空
432 声望470 粉丝

目前从事Java开发,喜欢游戏,业余时间自学游戏开发。