第一章 Java内存区域与内存溢出异常
1.1 运行时数据区域
线程共享数据区 | 线程私有数据区 |
---|---|
方法区、堆 | 虚拟机栈、本地方法栈、程序计数器 |
1.1.1 程序计数器
通过改变这个计数器的值来选取下一条需要执行的字节码指令,它是程序控制流的指示器,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖程序计数器完成。
如果线程执行的是Java方法,计数器记录的是正在执行的虚拟机字节码指令的地址;如果执行的是Native方法,计数器值则应为空(Undefined)。
此内存区域是唯一一个没有在《Java虚拟机规范》中规定任何OutOfMemoryError情况的区域。
1.1.2 Java虚拟机栈
虚拟机栈描述的是Java方法执行的线程内存模型:每个方法被执行的时候,Java虚拟机栈都会同步创建一个栈帧(Stack Frame)用于存储局部变量表、操作数栈、动态连接、方法出口等信息。
局部变量表:存放了编译期可知的各种基本数据类型(boolean, byte, char, short, int, float, long, doble)、对象引用(reference类型,并不等同于对象本身)和returnAddress类型(指向了一条字节码指令的地址)。这些数据类型在局部变量表中的存储空间在编译期间完成分配,并以局部变量槽(Slot)来表示,其中64位长度的long和double会占用两个变量槽,其余数据类型只占用一个(虚拟机具体使用多大的内存空间来实现一个变量槽,由虚拟机自行决定)。
异常:StackOverflowError和OutOfMemoryError.
1.1.3 本地方法栈
与虚拟机栈类似,为虚拟机使用到的Native方法服务。
异常:StackOverflowError和OutOfMemoryError.
HotSpot虚拟机不支持栈的动态扩展,所以除非在创建线程申请内存时就因无法获得足够的内存而出现OutOfMemoryError异常,否则在线程运行时是不会因为扩展而导致内存溢出的,只会因为栈容量无法容纳新的栈帧而导致StackOverflowError异常。可通过-Xss参数见着栈内存容量。
1.1.4 Java堆
几乎所有的对象都在堆上分配,但是由于即时编译技术的进步,尤其是逃逸分析技术的日渐强大,栈上分配、标量替换优化手段已经导致一些变化的发生。新生代、老年代、永久代、Eden、Survivor等基于“经典分代”来设计的HotSpot虚拟机,也在发生一些变化,不采用分代设计的新垃圾收集器。
通过参数-Xms与-Xmx设置对的最小值和最大值,两者设置一样可避免堆自动扩展;通过参数-XX:+HeapDumpOnOutOfMemoryError可以让虚拟机在出现内存溢出异常的时候Dump出当前的内存堆转存快照一遍进行事后分析。
异常:OutOfMemoryError.
1.1.5 方法区
方法区存储已被虚拟机加载的类型信息、常量、静态变量、即时编译器编译后的代码缓存等数据。与Java堆一样,不需要连续的内存和可以选择固定大小或者可扩展外,甚至还可以选择不实现垃圾收集。实现垃圾收集也主要是针对常量池的回收和对类型的卸载。
异常:OutOfMemoryError.
1.1.6 运行时常量池
运行时常量池是方法区的一部分。Class文件中除了有类的版本、字段、方法 、接口等描述信息外,还有一项信息是常量池表(Constant Pool Table),用于存放编译期生成的各种字面量与符号引用,这部分内容将在类加载后存放到方法区的运行时常量池中。
异常:OutOfMemoryError.
1.1.7 直接内存
直接内存(Direct Memory)并不是虚拟机运行时数据区的一部分,也不是《Java虚拟机规范》中定义的内存区域。在JDK1.4中新加入了NIO类,引入了一种基于通道(Channel)与缓冲区(Buffer)的I/O方式,它可以使用Native函数库直接分配堆外内存,然后通过一个存储在Java对中的DirectByteBuffer对象作为这块内存的引用进行操作,避免了在Java堆和Native堆中来回复制数据,提高性能。
直接内存的容量大小可通过-XX:MaxDirectMemorySize参数来指定,如果不指定,则默认与Java堆最大值(由-Xmx指定)一直。
1.2 HotSpot虚拟机对象探秘
1.2.1 对象的创建
- 类加载检查
当Java虚拟机遇到一条字节码new指令时,先去检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并检查该符号引用代表的类是否已被加载、解析和初始化过。如果没有,先执行相应的类加载过程。
- 内存分配
对象所需内存在类加载检查完成之后便可完全确定。其中有两种内存分配方式:1)指针碰撞(Bump The Pointer) :如果堆内存规整,将放在使用过的内存和空闲内存中间的指针向空闲内存侧移动对象大小的距离。2)空闲列表(Free List):如果堆内存并不规整,虚拟机需要维护一个列表,记录哪些内存块可用,在分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的记录。
针对并发情况下的内存分配有两种解决方案:一是对分配内存空间的动作进行同步处理(CAS配上失败重试保证原子性);二是把内存分配的动作按照线程划分在不同空间中进行,即每个线程在Java堆中与预先分配本地线程分配缓冲(Thread Local Allocation Buffer, TLAB),内存分配首先在本地缓冲区中进行,本地缓冲区用完后,分配新的缓冲区时才需要同步锁定。虚拟机可以通过-XX:+/-UseTLAB来决定是否使用TLAB.
然后虚拟机还需要对对象进行必要的设置,例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码和GC分代年龄等信息。
最后执行对象的构造函数,即Class文件中的<init>()方法。
1.2.2 对象的内存布局
在HotSpot虚拟机里,对象在堆内存中的存储布局可以划分为三个部分:对象头(Header)、实例数据(Instance Data)和对齐填充(Padding)。
-
对象头
HotSpot虚拟机对象的对象头部分包括两类信息。
-
用于存储对象自身运行时数据,如哈希码、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等,这部分数据的长度在32位和64位虚拟机(未开启压缩指针)中分别为32个比特和64个比特,官方成为“Mark Word”,其被设计成有着动态定义的数据结构。在各个状态下对象的存储内容如下:
存储内容 标志位 状态 对象哈希码、对象分代年龄 01 未锁定 指向锁记录的指针 00 轻量级锁定 指向重量级锁的指针 10 膨胀(重量级锁定) 空,不需要记录信息 11 GC标记 偏向线程ID、偏向时间戳、对象分代年龄 01 可偏向 - 类型指针,即对象指向它的类型元数据的指针,Java虚拟机通过这个指针来确定该对象是哪个类的实例。此外,如果对象是一个Java数组,那在对象头中还必须有一块用于记录数组长度的数据。
-
- 实例数据
该部分是对象真正存储的有效信息,即我们在程序代码里面所定义的各种类型的字段内容,无论是从父类继承下来的还是在子类中定义的字段。该部分存储顺序会受到虚拟机分配策略参数(-XX:FieldsAllocationStyle参数)和字段在Java源码中定义的顺序的影响。HotSpot虚拟机默认分配顺序为longs/doubles、ints、shorts/chars、bytes/booleans、oops(Ordinary Object Pointers,OOPs),从以上默认分配策略中可以看到,相同宽度的字段总是被分配到一起存放,在此前提条件下,在父类中定义的变量会出现在子类之前。如果HotSpot虚拟机的-XX:CompactFields参数值为true(默认为true),那子类中较窄的变量也允许插入父类变量的空隙之中。
- 对齐填充
该部分并不是必然存在的,没有特别的含义,仅仅起着占位符的作用。HotSpot虚拟机要求任何对象的大小都必须是8字节的整数倍,而对象头部分已经被精心设计成8字节的倍数(1倍或2倍),所以如果对象实例数据部分没有对齐的话,需要通过对齐填充来补全。
1.2.3 对象的访问定位
Java程序会通过栈上的reference数据来操作堆上的对象,具体访问方式由虚拟机实现而定,主流方式有句柄和直接指针量中:
- 句柄
Java堆中划分出一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据与类型数据各自具体的地址信息。
- 直接指针
reference中存储的直接是对象地址。HotSpot虚拟机主要使用直接指针来访问对象。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。