一、类加载器子系统

1.1 JVM体系结构

JVM被分为三个主要的子系统:

(1)类加载器子系统(2)运行时数据区(3)执行引擎

1.2 类加载器子系统作用

(1)类加载子系统负责从文件系统或者网络中加载class文件,class文件在文件开有特定的文件标识(0xCAFEBABE)。

(2)类加载器(Class Loader)只负责class文件的加载,至于它是否可以运行,则由执行引擎(Execution Engine)决定。

(3)加载的类信息存放于一块称为方法区的内存空间。除了类的信息外,方法区中还会存放运行时常量池信息,可能还包括字符串字面量和数字常量(这部分常量信息是Class文件中常量池部分的内存映射)。

(4)Class对象是存放在堆区的。

假如有一个Car.java文件,编译后生成一个Car.class字节码文件:

  • class file存在于本地硬盘上,可以理解为一个模板。而这个模板在执行的时候是需要加载到JVM当中,JVM再根据这个模板实例化出N个一模一样的实例。
  • class file加载到JVM中后,被称为DNA元数据模板,放在方法区。
  • 在.class文件-->JVM-->最终成为元数据模板,此过程就要一个运输工具(类装载器Class Loader),扮演一个快递员的角色。

1.3 类的加载过程

一个类型从被加载到虚拟机内存中开始,到卸载出内存为止,它的整个生命周期将会经历加载(Loading)、验证(Verification)、准备(Preparation)、解析(Resolution)、初始化(Initialization)、使用(Using)和卸载(Unloading)七个阶段,其中验证、准备、解析三个部分统称为连接(Linking)。完整的流程图如下所示:

加载、验证、准备、初始化和卸载这五个阶段的顺序是确定的。为了支持Java语言的运行时绑定解析阶段也可以是在初始化之后进行的。(以上顺序流程指的是程序开始的顺序,在实际运行中,这些阶段通常都是互相交叉地混合进行的,会在一个阶段执行的过程中调用、激活另一个阶段)。

(1)加载阶段

“加载”(Loading)阶段是整个“类加载”(Class Loading)过程中的一个阶段,JVM需要完成三件事:

  • 通过一个类的全限定名获取定义此类的二进制字节流。
  • 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构。
  • 在内存中生成一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据的访问入口。

加载class文件的方式

  • 从本地系统中直接加载。
  • 通过网络获取,典型场景:Web Applet。
  • 从zip压缩包中读取,成为日后jar、war格式的基础。
  • 运行时计算生成,使用最多的是:动态代理技术。
  • 由其他文件生成,典型场景:JSP应用从专有数据库中提取.class文件,比较少见。
  • 从加密文件中获取,典型的防Class文件被反编译的保护措施。
  • ... ...

(2)链接阶段

  1. 验证 Verify

目的在于确保Class文件的字节流中包含信息符合当前虚拟机要求,保证被加载类的正确性,不会危害虚拟机自身安全。

主要包括四种验证:文件格式验证,元数据验证,字节码验证,符号引用验证。

文件格式验证

第一阶段要验证字节流是否符合Class文件格式的规范,并且能被当前版本的虚拟机处理。

  • 是否以魔数0xCAFEBABE开头。
  • 主、次版本号是否在当前Java虚拟机接受范围之内。
  • 常量池的常量中是否有不被支持的常量类型(检查常量tag标志)。
  • 指向常量的各种索引值中是否有指向不存在的常量或不符合类型的常量。
  • CONSTANT_Utf8_info型的常量中是否有不符合UTF-8编码的数据。
  • Class文件中各个部分及文件本身是否有被删除的或附加的其他信息。

元数据验证

第二阶段是对字节码描述的信息进行语义分析。

  • 这个类是否有父类(除了java.lang.Object之外,所有的类都应当有父类)。
  • 这个类的父类是否继承了不允许被继承的类(被final修饰的类)。
  • 如果这个类不是抽象类,是否实现了其父类或接口之中要求实现的所有方法。
  • 类中的字段、方法是否与父类产生矛盾(例如覆盖了父类的final字段,或者出现不符合规则的方法重载,例如方法参数都一致,但返回值类型却不同等)。

字节码验证

通过数据流分析和控制流分析,确定程序语义是合法的、符合逻辑的。

  • 保证任意时刻操作数栈的数据类型与指令代码序列都能配合工作,例如不会出现类似于“在操作栈放置了一个int类型的数据,使用时却按long类型来加载入本地变量表中”这样的情况。
  • 保证任何跳转指令都不会跳转到方法体以外的字节码指令上。
  • 保证方法体中的类型转换总是有效的。

符号引用验证

对类自身以外(常量池中的各种符号引用)的各类信息进行匹配性校验,通俗来说就是,该类是否缺少或者被禁止访问它依赖的某些外部类、方法、字段等资源。

  • 符号引用中通过字符串描述的全限定名是否能找到对应的类。
  • 在指定类中是否存在符合方法的字段描述符及简单名称所描述的方法和字段。
  • 符号引用中的类、字段、方法的可访问性(private、protected、public、<package>)是否可被当前类访问。

我们可以通过安装IDEA的插件——jclasslib Bytecode viewer,来查看我们的Class文件:

安装完成后,我们编译完一个class文件后,点击View--> Show Bytecode With Jclasslib即可显示我们安装的插件来查看字节码。

  1. 准备 Prepare
  • 为类变量分配内存并且设置该类变量的默认初始值,即零值。(Boolean类型数据的零值为False)

例如下面这段代码:

public class Hello {
    private static int a = 1;  // 准备阶段为0,在下个阶段,也就是初始化的时候才是1。
    public static void main(String[] args) {
        System.out.println(a);
    }
}
  • 这里不包含用final修饰的static,因为final在编译的时候就会分配了,准备阶段会显式初始化
  • 这里不会为实例变量分配初始化,类变量会分配在方法区中,而实例变量是会随着对象一起分配到Java堆中。
  1. 解析 Resolve
  • 将常量池内的符号引用转换为直接引用的过程
  • 事实上,解析操作往往会伴随着JVM在执行完初始化之后再执行。
  • 符号引用就是一组符号来描述所引用的目标。符号引用的字面量形式明确定义在《java虚拟机规范》的class文件格式中。直接引用就是直接指向目标的指针、相对偏移量或一个间接定位到目标的句柄。
  • 解析动作主要针对类或接口、字段、类方法、接口方法、方法类型等。对应常量池中的CONSTANT Class info、CONSTANT Fieldref info、CONSTANT_Methodref_info等。

(3)初始化阶段

初始化阶段就是执行类构造器法<clinit>()的过程。此方法不需定义,是javac编译器自动收集类中的所有类变量的赋值动作和静态代码块(static{}块)中的语句合并而来,编译器收集的顺序是由语句在源文件中出现的顺序决定的。

  • 也就是说,当我们代码中包含static变量的时候,就会有<clinit>()方法

<clinit>()不同于类的构造器函数。(关联:构造器函数是虚拟机视角下的<init>()方法。若该类具有父类,JVM会保证子类的<clinit>()执行前,父类的<clinit>()已经执行完毕。因此在Java虚拟机中第一个被执行的<clinit>()方法的类型肯定是java.lang.Object

  • 任何一个类在声明后,都有生成一个构造器,默认是空参构造器
public class ClassInitTest {
    private static int num = 1;
    static {
        num = 2;
        number = 20;
        System.out.println(num);
        System.out.println(number);  //报错,非法的前向引用
    }

    private static int number = 10; // prepare:number = 0--> number-->initial: 20-->10

    public static void main(String[] args) {
        System.out.println(ClassInitTest.num); // 2
        System.out.println(ClassInitTest.number); // 10
    }
}

关于涉及到父类时候的变量赋值过程:

public class ClinitTest {
    static class Father {
        public static int A = 1;
        static {
            A = 2;
        }
    }

    static class Son extends Father {
        public static int B = A;
    }

    public static void main(String[] args) {
        // 加载Father类,其次加载Son类
        System.out.println(Son.B);
    }
}

我们输出结果为 2,也就是说首先加载ClinitTest的时候,会找到main方法,然后执行Son的初始化,但是Son继承了Father,因此还需要执行Father的初始化,同时将A赋值为2。我们通过反编译得到Father的加载过程,首先我们看到原来的值被赋值成1,然后又被复制成2,最后返回:

iconst_1
putstatic #2 <com/kai/jvm/ClinitTest1$Father.A>
iconst_2
putstatic #2 <com/kai/jvm/ClinitTest1$Father.A>
return

虚拟机必须保证一个类的<clinit>()方法在多线程下被同步加锁。

public class DeadThreadTest {
    public static void main(String[] args) {
        new Thread(() -> {
            System.out.println(Thread.currentThread().getName() + "\t 线程t1开始");
            new DeadThread();
        }, "t1").start();

        new Thread(() -> {
            System.out.println(Thread.currentThread().getName() + "\t 线程t2开始");
            new DeadThread();
        }, "t2").start();
    }
}
class DeadThread {
    static {
        if (true) {
            System.out.println(Thread.currentThread().getName() + "\t 初始化当前类");
            while(true) {
            }
        }
    }
}

上面的代码,输出结果为:

线程t1开始
线程t2开始
线程t2 初始化当前类

从上面可以看出只能够执行一次初始化,其中一条线程一直在阻塞等待。

二、类加载器

2.1 类加载器的分类

在类加载阶段中,实现“通过一个类的全限定名来获取描述该类的二进制字节流”这个动作的代码就被称为“类加载器”(ClassLoader)。

JVM支持两种类型的类加载器 ,分别为启动类加载器(Bootstrap ClassLoader)和自定义类加载器(User-Defined ClassLoader)。

从概念上来讲,自定义类加载器一般指的是程序中由开发人员自定义的一类类加载器,但是Java虚拟机规范却没有这么定义,而是将所有派生于抽象类ClassLoader的类加载器都划分为自定义类加载器。

无论类加载器的类型如何划分,在程序中我们最常见的类加载器主要有3类,如下所示:

Tips:各类加载器之间的关系不是传统意义上的继承关系。

我们通过一个类,获取不同的加载器:

public class ClassLoaderTest {
    public static void main(String[] args) {
        // 获取系统类加载器
        ClassLoader systemClassLoader = ClassLoader.getSystemClassLoader();
        System.out.println(systemClassLoader);

        // 获取扩展类加载器
        ClassLoader extClassLoader = systemClassLoader.getParent();
        System.out.println(extClassLoader);

        // 获取启动类加载器
        ClassLoader bootstrapClassLoader = extClassLoader.getParent();
        System.out.println(bootstrapClassLoader);

        // 获取自定义加载器
        ClassLoader classLoader = ClassLoaderTest.class.getClassLoader();
        System.out.println(classLoader);
        
        // 获取String类型的加载器
        ClassLoader classLoader1 = String.class.getClassLoader();
        System.out.println(classLoader1);
    }
}

得到的结果,从结果可以看出启动类加载器无法通过代码直接获取,同时目前用户代码所使用的加载器为系统类加载器。同时我们通过获取String类型的加载器,发现是null,这间接说明了String类型是通过启动类加载器进行加载的。(Java的核心类库都是使用启动类加载器进行加载的

sun.misc.Launcher$AppClassLoader@18b4aac2
sun.misc.Launcher$ExtClassLoader@4554617c
null
sun.misc.Launcher$AppClassLoader@18b4aac2
null

2.2 虚拟机自带的加载器

  1. 启动类加载器(引导类加载器,Bootstrap ClassLoader)
  • 这个类加载使用C/C++语言实现的,嵌套在JVM内部。
  • 它用来加载Java的核心库(JAVA_HOME/jre/lib/rt.jarresources.jar或sun.boot.class.path路径下的内容),用于提供JVM自身需要的类。
  • 并不继承自ava.lang.ClassLoader,没有父加载器。
  • 加载扩展类和应用程序类加载器,并指定为他们的父类加载器。
  • 出于安全考虑,Bootstrap启动类加载器只加载包名为java、javax、sun等开头的类。

我们通过下面代码验证一下:

public class ClassLoaderTest {
    public static void main(String[] args) {
        System.out.println("*********启动类加载器************");
        // 获取BootstrapClassLoader能够加载的API的路径
        URL[] urls = sun.misc.Launcher.getBootstrapClassPath().getURLs();
        for (URL url : urls) {
            System.out.println(url.toExternalForm());
        }

        // 从上面路径中,随意选择一个类,来看看他的类加载器是什么:得到的是null,则说明是启动类加载器
        ClassLoader classLoader = Provider.class.getClassLoader();
        System.out.println(classLoader);
    }
}

得到的结果(%20是空格):

*********启动类加载器************
file:/C:/Program%20Files/Java/jdk1.8.0_151/jre/lib/resources.jar
file:/C:/Program%20Files/Java/jdk1.8.0_151/jre/lib/rt.jar
file:/C:/Program%20Files/Java/jdk1.8.0_151/jre/lib/sunrsasign.jar
file:/C:/Program%20Files/Java/jdk1.8.0_151/jre/lib/jsse.jar
file:/C:/Program%20Files/Java/jdk1.8.0_151/jre/lib/jce.jar
file:/C:/Program%20Files/Java/jdk1.8.0_151/jre/lib/charsets.jar
file:/C:/Program%20Files/Java/jdk1.8.0_151/jre/lib/jfr.jar
file:/C:/Program%20Files/Java/jdk1.8.0_151/jre/classes
null
  1. 扩展类加载器(Extension ClassLoader)
  • Java语言编写,由sun.misc.Launcher$ExtClassLoader实现。
  • 派生于ClassLoader类。
  • 父类加载器为启动类加载器。
  • 从java.ext.dirs系统属性所指定的目录中加载类库,或从JDK的安装目录的jre/lib/ext子目录(扩展目录)下加载类库。如果用户创建的JAR放在此目录下,也会自动由扩展类加载器加载。

我们通过下面代码验证一下:

public class ClassLoaderTest {
    public static void main(String[] args) {
        System.out.println("*********扩展类加载器************");
        String extDirs = System.getProperty("java.ext.dirs");
        for (String path : extDirs.split(";")) {
            System.out.println(path);
        }

        // Java\lib\ext目录下随意选择一个类,查看他的类加载器是什么
        ClassLoader classLoader = CurveDB.class.getClassLoader();
        System.out.println(classLoader);
    }
}

得到的结果:

*********扩展类加载器************
C:\Program Files\Java\jdk1.8.0_151\jre\lib\ext
C:\WINDOWS\Sun\Java\lib\ext
sun.misc.Launcher$ExtClassLoader@7ea987ac
  1. 系统类加载器(应用程序类加载器,AppClassLoader)
  • Java语言编写,由sun.misc.Launcher¥AppClassLoader实现。
  • 派生于ClassLoader类。
  • 父类加载器为扩展类加载器。
  • 它负责加载环境变量classpath或系统属性java.class.path指定路径下的类库。
  • 该类加载是程序中默认的类加载器,一般来说,Java应用的类都是由它来完成加载。
  • 通过classLoader#getSystemclassLoader()方法可以获取到该类加载器。

2.3 用户自定义类加载器

在Java的日常应用程序开发中,类的加载几乎是由上述3种类加载器相互配合执行的,在必要时,我们还可以自定义类加载器,来定制类的加载方式。
为什么要自定义类加载器?

  • 隔离加载类
  • 修改类加载的方式
  • 扩展加载源
  • 防止源码泄漏

用户自定义类加载器实现步骤:

  • 开发人员可以通过继承抽象类ava.lang.ClassLoader类的方式,实现自己的类加载器,以满足一些特殊的需求
  • 在JDK1.2之前,在自定义类加载器时,总会去继承ClassLoader类并重写loadClass()方法,从而实现自定义的类加载类,但是在JDK1.2之后已不再建议用户去覆盖1oadclass()方法,而是建议把自定义的类加载逻辑写在findclass()方法中
  • 在编写自定义类加载器时,如果没有太过于复杂的需求,可以直接继承URIClassLoader类,这样就可以避免自己去编写findclass()方法及其获取字节码流的方式,使自定义类加载器编写更加简洁。

2.4 ClassLoader类

ClassLoader类,它是一个抽象类,其后所有的类加载器都继承自ClassLoader(不包括启动类加载器)。

方法名称描述
getParent()返回该类加载器的超类加载器
loadClass(String name)加载名称为name的类,返回结果为java.lang.Class类的实例
findClass(String name)查找名称为name的类,返回结果为java.lang.Class类的实例
findLoadedClass(String name)查找名称为name的已经被加载过的类,返回结果为java.lang.Class类的实例
defineClass(String name, byte[] b, int off, int len)把字节数组b中的内容转换为一个Java类,返回结果为java.lang.Class类的实例
resolveClass(Class<?> c)连接指定的一个Java类

获取ClassLoader的途径:

  • 获取当前ClassLoader:clazz.getClassLoader()
  • 获取当前线程上下文的ClassLoader:Thread.currentThread().getContextClassLoader()
  • 获取系统的ClassLoader:ClassLoader.getSystemClassLoader()
  • 获取调用者的ClassLoader:DriverManager.getCallerClassLoader()

三、双亲委派机制

Java虚拟机对class文件采用的是按需加载的方式,也就是说当需要使用该类时才会将它的class文件加载到内存生成class对象。而且加载某个类的class文件时,Java虚拟机采用的是双亲委派模式,即把优先将请求交由父类处理,它是一种任务委派模式。

3.1 工作原理

  • 如果一个类加载器收到了类加载请求,它并不会自己先去加载,而是把这个请求委托给父类的加载器去执行;
  • 如果父类加载器还存在其父类加载器,则进一步向上委托,依次递归,请求最终将到达顶层的启动类加载器;
  • 如果父类加载器可以完成类加载任务,就成功返回,倘若父类加载器无法完成此加载任务,子加载器才会尝试自己去加载,这就是双亲委派模式。(注意,此处的父类、子类不是继承中父类、子类的概念。)

下面用一个例子说明:

public class StringTest {
    public static void main(String[] args) {
        String string = new String();
        System.out.println("Hello World!");
    }
}

然后自定义一个java.lang.String类:

public class String {
    static {
        System.out.println("这是自定义的String类的静态代码块!");
    }
}

执行结果:Hello World!

3.2 双亲委派机制举例

当我们加载jdbc.jar 用于实现数据库连接的时候,首先我们需要知道的是 jdbc.jar是基于SPI接口进行实现的,所以在加载的时候,会进行双亲委派,最终从启动类加载器中加载 SPI核心类。然后再加载SPI接口实现类,就进行反向委派,通过线程上下文类加载器进行实现jdbc.jar的加载。

3.3 双亲委派机制的优势

  • 避免类的重复加载
  • 保护程序安全,防止核心API被随意篡改

    • 自定义类:java.lang.String
    • 自定义类:java.lang.XXXX(报错:阻止创建 java.lang开头的类)

3.4 沙箱安全机制

Java安全模型的核心就是Java沙箱(sandbox)。沙箱是一个限制程序运行的环境。沙箱机制就是将 Java 代码限定在虚拟机(JVM)特定的运行范围中,并且严格限制代码对本地系统资源访问,通过这样的措施来保证对代码的有效隔离,防止对本地系统造成破坏。

组成Java沙箱的基本组件如下:

  • 类加载体系结构
  • class文件检验器
  • 内置于Java虚拟机(及语言)的安全特性
  • 安全管理器及Java API

Java安全模型的前三个部分——类加载体系结构、class文件检验器、Java虚拟机(及语言)的安全特性一起达到一个共同的目的:保持Java虚拟 机的实例和它正在运行的应用程序的内部完整性,使得它们不被下载的恶意代码或有漏洞的代码侵犯。相反,这个安全模型的第四个组成部分是安全管理器,它主要 用于保护虚拟机的外部资源不被虚拟机内运行的恶意或有漏洞的代码侵犯。这个安全管理器是一个单独的对象,在运行的Java虚拟机中,它在对于外部资源的访 问控制起中枢作用。

例如,自定义一个java.lang.String类,但是在加载自定义String类的时候会率先使用启动类加载器加载,而启动类加载器在加载的过程中会先加载jdk自带的文件(rt.jar包java.lang.中javalangString.class),报错信息说没有main方法,就是因为加载的是rt.jar包中的string类。这样可以保证对java核心源代码的保护,这就是沙箱安全机制。

public class String {
    static {
        System.out.println("这是自定义的String类的静态代码块!");
    }
    
    // 错误
    public static void main(String[] args) {
        System.out.println("Hello World!");
    }
}

四、补充

5.1 比较class对象

在JVM中表示两个class对象是否为同一个类存在两个必要条件:

  • 类的完整类名必须一致,包括包名。
  • 加载这个类的ClassLoader(指ClassLoader实例对象)必须相同。

换句话说,在JVM中,即使这两个类对象(class对象)来源同一个Class文件,被同一个虚拟机所加载,但只要加载它们的ClassLoader实例对象不同,那么这两个类对象也是不相等的。

JVM必须知道一个类型是由启动加载器加载的还是由用户类加载器加载的。如果一个类型是由用户类加载器加载的,那么JVM会将这个类加载器的一个引用作为类型信息的一部分保存在方法区中。当解析一个类型到另一个类型的引用的时候,JVM需要保证这两个类型的类加载器是相同的。

5.2 类的主动使用和被动使用

Java程序对类的使用方式分为:主动使用和被动使用
主动使用,又分为七种情况:

  • 创建类的实例
  • 访问某个类或接口的静态变量,或者对该静态变量赋值
  • 调用类的静态方法I
  • 反射(比如:Class.forName("com.kai.Test"))
  • 初始化一个类的子类
  • Java虚拟机启动时被标明为启动类的类
  • JDK7开始提供的动态语言支持:
  • java.lang.invoke.MethodHandle实例的解析结果REF getStatic、REF putStatic、REF invokeStatic句柄对应的类没有初始化,则初始化

除了以上七种情况,其他使用Java类的方式都被看作是对类的被动使用,都不会导致类的初始化

参考

深入理解Java虚拟机:JVM高级特性与最佳实践(第3版)

java中的安全模型(沙箱机制)


思思问问
27 声望5 粉丝

Stay Hungry, Stay Foolish!