判断对象是否存活

  1. 引用计数法
    引用计数法的实现简单,执行效率也很高,每当一个地方引用它时,计数器值就加一,当引用失效是,计数器值减一,任何时候当计数器值为0时都不可能被使用的。
    但是目前主流的虚拟机都没有使用这个算法,主要是该算法不能解决对象之间循环利用的问题。
  2. 可达性分析算法
    这个算法的思想是通过一系列成为GC Roots的对象作为起点,从这些节点开始向下搜索, 节点所走过的路径称之为引用链,当一个对象到GC Roots没有任何引用链相连的话,则证明该对象不可用。
    image.png
    在Java语言中,可以成为GC Roots的对象包括下面几种:

    1. 虚拟机栈(栈帧中的本地变量表)中引用的对象
    2. 方法去中类静态属性引用的变量
    3. 方法区中常量引用的对象
    4. 本地方法栈中JNI(即Native方法)引用的对象
GC堆中的主要管理区域是堆,一般情况下只针对堆进行垃圾回收,虚拟机栈,方法区,本地方法栈不会被GC所管理,因而选择这些区域对象作为GC Roots,被GC Roots引用的对象不会被GC回收
  1. 再谈引用
    JDK1.2 以后,Java 对引用的概念进行了扩充,将引用分为强引用、软引用、弱引用、虚引用四种(引用强度逐渐减弱)

    1. 强引用:如果一个对象具有强引用,那就类似于必不可少的生活用品,垃圾回收器绝不会回收它。当内存空间不足,Java 虚拟机宁愿抛出 OutOfMemoryError 错误,使程序异常终止,也不会靠随意回收具有强引用的对象来解决内存不足问题。
    2. 软引用:如果内存空间足够,垃圾回收器就不会回收它,如果内存空间不足了,就会回收这些对象的内存。只要垃圾回收器没有回收它,该对象就可以被程序使用。软引用可用来实现内存敏感的高速缓存。
    3. 弱引用:弱引用也是用来描述非必需对象的,但是它的强度比软引用更弱一些,被弱引用关联的对象只能生存到下一次垃圾收集发生之前。当垃圾收集器工作时,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。
    4. 虚引用:为一个对象设置虚引用关联的唯一目的就是能在这个对象被收集器回收时收到一个系统通知。
  2. 不可达的对象并非“非死不可
    即使在可达性分析法中不可达的对象,也并非是“非死不可”的,这时候它们暂时处于“缓刑阶段”,要真正宣告一个对象死亡,至少要经历两次标记过程;可达性分析法中不可达的对象被第一次标记并且进行一次筛选,筛选的条件是此对象是否有必要执行 finalize 方法。当对象没有覆盖 finalize 方法,或 finalize 方法已经被虚拟机调用过时,虚拟机将这两种情况视为没有必要执行。

    被判定为需要执行的对象将会被放在一个队列中进行第二次标记,除非这个对象与引用链上的任何一个对象建立关联,否则就会被真的回收。

  3. 如何判断一个常量是废弃常量
    假如在常量池中存在字符串 "abc",如果当前没有任何 String 对象引用该字符串常量的话,就说明常量 "abc" 就是废弃常量,如果这时发生内存回收的话而且有必要的话,"abc" 就会被系统清理出常量池。

垃圾收集算法

  1. 标记-清除算法
    该算法分为标记和清除两部分,首先标记出所有需要回收的对象,在标记完成后统一进行回收。这种垃圾收集算法有着明显的问题。

    1. 效率问题(标记和清除两个过程效率都不高)
    2. 空间问题(标记清除之后产生大量不连续的内存碎片)
  2. 复制算法
    复制算法将内存划分成两个大小一致的内存区域,每次只使用其中的一块,当这一块内存使用完成后,将存活的对象复制到另一块,然后再把使用的空间一次清理掉。这样使得每次内存回收都是对内存区间的一半进行回收
  3. 标记-整理算法
    这个是根据老年代的特点提出的一种标记算法,标记过程依然与标记-清除算法一样,但后续不是直接对标记对象进行回收,而是让存活对象向一端移动,然后直接清理掉端边界之外的内存
  4. 分代收集算法
    分代收集算法,只是根据对象的生命周期将内存分为几块,一般将堆分成新生代和老年代,这样我们可以根据各种年代的特点选择不同的垃圾收集算法
    比如新生代中,每次收集都有大量的对象死亡,这样,我们可以使用复制算法,而老年代的对象存活几率是比较高的,而且没有额外的空间对其进行分配担保,所以我们选择标记-整理算法。

内存的分配和回收

  1. 堆空间的基本结构
    由于目前的收集算法基本都采用分代收集算法,所以堆还可以划分为,新生代(Eden,From Survivor,To Survivor)和老年代,进一步划分的目的是更好的回收内存,或者更快的分配内存。
    image.png
    上图所示的eden,s0("From")区,s1("To")区都属于新生代,Tenured属于老年代。
    内存分配:大部分对象会先在Eden区分配,再一次新生代垃圾回收后,如果对象还存活,则会进入到S1("To")区,并且对象的年龄加一(Eden区->Survivor区后对象的初始年龄变为1),当它的年龄增加到一定的程度(默认为15),就会被晋升到老年代中,对象晋升到老年代的年龄可以通过-xx:MaxTenuringThreshold来设置,经过这次GC后,Eden区和S0("From")区已经被清空,这个时候"From"和"To"会交换他们的角色,也就是说新的To会变成之前的From,不管怎么样,都要保证Survivor中的To区域是空的,Minor GC一直重复这样的操作,直到To区被填满,如果To区被填满将根据分配担保机制将所有的对象移动到老年代中。
    image.png

    1. 新生代 GC(Minor GC):指发生新生代的的垃圾收集动作,Minor GC 非常频繁,回收速度一般也比较快。
    2. 老年代 GC(Major GC/Full GC):指发生在老年代的 GC,出现了 Major GC 经常会伴随至少一次的 Minor GC(并非绝对),Major GC 的速度一般会比 Minor GC 的慢 10 倍以上。
    3. 当Eden区域内存被分配完了,就会进行一次Minor GC操作
    4. 大对象进入老年代:大对象就是需要大量连续内存的对象(如:字符串,数组)

垃圾收集器

  1. Serial收集器
    这个收集器是一个单线程的收集器,但它的“单线程”的意义并不仅仅说明它只会使用一个CPU或一条收集线程去完成垃圾收集工作,更重要的是在它进行垃圾收集时,必须暂停其他所有的工作线程,直到它收集结束。它依然是虚拟机运行在Client模式下的默认新生代收集器
    image.png
  2. ParNew收集器
    ParNew收集器其实是Serial收集器的多线程版本,它是运行在Server模式下虚拟机的首选,因为只有它能够和CMS收集器配合工作
  3. Parallel Scavenge收集器
    Parallel Scavenge也是使用复制算法的多线程收集器,看起来和ParNew几乎一致。
    Parallel Scavenge 收集器关注点是吞吐量(高效率的利用 CPU)。CMS 等垃圾收集器的关注点更多的是用户线程的停顿时间(提高用户体验)。所谓吞吐量就是 CPU 中用于运行用户代码的时间与 CPU 总消耗时间的比值。即吞吐量= 运行用户代码时间/(运行用户代码时间+垃圾收集时间),主要适合在后台运算而不需要太多交互的工作。
    Parallel Scavenge收集器提供了两个参数用于精准控制吞吐量,分别是控制最大垃圾收集停顿时间的-XX:MaxGCPauseMillis参数以及直接设置吞吐量大小的-XX:GCTimeRatio参数。
    Parallel Scavenge收集器还有一个重要的参数-XX:+UseAdaptiveSizePolicy值得关注,这是一个开关参数,这个参数打开之后就不需要手工指定新生代的大小,Eden与Survivor区的比例,晋升老年代的年龄等细节参数了。虚拟机会根据当前系统运行情况收集性能监控信息,动态的调整这些参数以提供最合适的停顿时间或者最大的吞吐量。这种调节方式被称为GC自适应的调节策略
  4. Serial Old收集器
    Serial 收集器的老年代版本,它同样是一个单线程收集器。它主要有两大用途:一种用途是在 JDK1.5 以及以前的版本中与 Parallel Scavenge 收集器搭配使用,另一种用途是作为 CMS 收集器的后备方案。
  5. Parallel Old收集器
    Parallel Scavenge 收集器的老年代版本。使用多线程和“标记-整理”算法。在注重吞吐量以及 CPU 资源的场合,都可以优先考虑 Parallel Scavenge 收集器和 Parallel Old 收集器。
  6. CMS收集器
    CMS(Concurrent Mark Sweep)收集器是一种以获取最短回收停顿时间为目标的收集器。目前很大一部分的Java应用集中在互联网站或者B/S系统的服务端上,这类应用尤其重视服务的响应速度,希望系统停顿时间最短,以给用户带来较好的体验。CMS收集器就非常符合这类应用的需求。
    CMS 收集器是一种“标记-清除”算法实现的

    1. 初始标记:暂停所有的其他线程,并标记一下直接与 GC Roots相连的对象,速度很快;
    2. 并发标记:同时开启GC和用户线程,用一个闭包结构去记录可达对象。但在这个阶段结束,这个闭包结构并不能保证包含当前所有的可达对象。因为用户线程可能会不断的更新引用域,所以 GC 线程无法保证可达性分析的实时性。所以这个算法里会跟踪记录这些发生引用更新的地方。
    3. 重新标记:重新标记阶段就是为了修正并发标记期间因为用户程序继续运行而导致标记产生变动的那一部分对象的标记记录,这个阶段的停顿时间一般会比初始标记阶段的时间稍长,远远比并发标记阶段时间短
    4. 并发清除:开启用户线程,同时 GC 线程开始对为标记的区域做清扫

      CMS主要优点:并发收集、低停顿,缺点:对 CPU 资源敏感,无法处理浮动垃圾,它使用的回收算法-“标记-清除”算法会导致收集结束时会有大量空间碎片产生。

  7. G1收集器
    G1 (Garbage-First) 是一款面向服务器的垃圾收集器,主要针对配备多颗处理器及大容量内存的机器. 以极高概率满足 GC 停顿时间要求的同时,还具备高吞吐量性能特征.

    1. 并行与并发:G1 能充分利用 CPU、多核环境下的硬件优势,使用多个 CPU(CPU 或者 CPU 核心)来缩短 Stop-The-World 停顿时间。部分其他收集器原本需要停顿 Java 线程执行的 GC 动作,G1 收集器仍然可以通过并发的方式让 java 程序继续执行。
    2. 分代收集:虽然 G1 可以不需要其他收集器配合就能独立管理整个 GC 堆,但是还是保留了分代的概念。但它能够采用不同的方式去处理新创建的对象和已经存活了一段时间、熬过多次GC的旧对象以获取更好的收集效果。
    3. 空间整合:与 CMS 的“标记--清理”算法不同,G1 从整体来看是基于“标记整理”算法实现的收集器;从局部上来看是基于“复制”算法实现的。
    4. 可预测的停顿:这是 G1 相对于 CMS 的另一个大优势,降低停顿时间是 G1 和 CMS 共同的关注点,但 G1 除了追求低停顿外还能建立可预测的停顿时间模型,能让使用者明确指定在一个长度为M毫秒的时间片段内。
  • G1 收集器的运作大致分为以下几个步骤:

    1. 初始标记

      初始标记阶段仅仅只是标记一下GC Roots能直接关联到的对象,并且修改TAMS(Next Top at Mark Start)的值,让下一阶段用户程序并发运行时,能在正确可用的Region中创建新对象,这阶段需要停顿线程,但耗时很短。并发标记阶段是从GC
    2. 并发标记

      并发标记阶段是从GC Root开始对堆中对象进行可达性分析,找出存活的对象,这阶段耗时较长,但可与用户程序并发执行。
    3. 最终标记

      最终标记阶段需要把Remembered Set Logs的数据合并到Remembered Set中,这阶段需要停顿线程,但是可并行执行。最后在筛选回收阶段首先对各个Region的回收价值和成本进行排序,根据用户所期望的GC停顿时间来制定回收计划
    4. 筛选回收
  • 在G1之前的其他收集器进行收集的范围都是整个新生代或者老年代,而G1不再是这样。使用G1收集器时,Java堆的内存布局就与其他收集器有很大差别,它将整个Java堆划分为多个大小相等的独立区域(Region),虽然还保留有新生代和老年代的概念,但新生代和老年代不再是物理隔离的了,它们都是一部分Region(不需要连续)的集合。
  • G1收集器之所以能建立可预测的停顿时间模型,是因为它可以有计划地避免在整个Java堆中进行全区域的垃圾收集。G1跟踪各个Region里面的垃圾堆积的价值大小(回收所获得的空间大小以及回收所需时间的经验值),在后台维护一个优先列表,每次根据允许的收集时间,优先回收价值最大的Region(这也就是Garbage-First名称的来由)。这种使用Region划分内存空间以及有优先级的区域回收方式,保证了G1收集器在有限的时间内可以获取尽可能高的收集效率。
  • G1 收集器在后台维护了一个优先列表,每次根据允许的收集时间,优先选择回收价值最大的 Region(这也就是它的名字 Garbage-First 的由来)。这种使用 Region 划分内存空间以及有优先级的区域回收方式,保证了 G1 收集器在有限时间内可以尽可能高的收集效率(把内存化整为零)。

涅之舞
0 声望0 粉丝

我站在屋内看窗外