1
头图

这是《图解 Google V8》第三篇/共三篇:事件循环和垃圾回收

这里主要讲了 2 点:

  1. 事件循环:宏任务和微任务

    • 什么是微任务
    • 微任务的执行时机
  2. 垃圾回收

    • 垃圾回收运行过程
    • 垃圾回收算法

通过这个专栏的学习,V8 不在是个陌生的黑盒了,变成了一个熟悉的黑盒,因为这个专栏让你了解了 V8 的大致原理,面试时吹吹牛皮还是可以的,不过也就仅此而已,细节方面还需要自己去深入

17 | 消息队列:V8 是怎么实现回调函数的?

  • 同步回调函数是在执行函数内部被执行的
  • 异步回调函数是在执行函数外部被执行的

UI 线程是运行窗口的线程,也叫主线程

当鼠标点击了页面,系统会将该事件交给 UI 线程来处理,但是 UI 线程不能立即响应来处理

针对这种情况,浏览器为 UI 线程提供了消息队列,然后 UI 线程会不断的从消息队列中取出事件和执行事件,如果当前没有任何消息等待被处理,那么这个循环就会被挂起

setTimeout

在执行 setTimeout,浏览器会将回调函数封装成一个事件,添加到消息队列中,然后 UI 线程会不间断的从消息队列中取出任务,执行任务,在合适的时机取出 setTimeout 的回调函数

XMLHttpRequest

UI 线程执行 XMLHttpRequest,会阻塞 UI 线程,所以 UI 线程会将它分配给网络线程(是网络进程中的一个线程):

  1. UI 线程从消息队列中取出任务,分析
  2. 发现是一个下载任务,就会交给网络线程去执行
  3. 网络线程接到下载请求后,会和服务器建立联系,发出下载请求
  4. 网络线程不断从服务器接收数据
  5. 网络请求在收到数据后,会将返回的数据和回调函数封装成一个事件,放在消息队列中
  6. UI 线程循环读取消息队列,如果是下载状态的事件,UI 线程就会执行回调函数
  7. 直到下载事件结束,页面显示下载完成

18 | 异步编程(一):V8 是如何实现微任务的?

宏任务是消息队列中等待被主线程执行的事件,每个宏任务在执行的时候都会创建栈,宏任务结束,栈也会被清空

微任务是一个需要异步执行的函数,执行时机是在主函数执行结束之后,当前宏任务结束之前

微任务执行的时机:

  1. 如果当前任务中产生了一个微任务,不会再当前的函数中被执行,所以执行微任务时,不会导致栈的无限扩张
  2. 微任务会在当前任务执行结束之前被执行
  3. 微任务结束执行之前,不会执行其他的任务

参考资料

  1. V8 Promise 源码全面解读
  2. JavaScript Event Loop vs Node JS Event Loop

19 |异步编程(二):V8 是如何实现 async/await 的?

生成器 Generator

带星号的函数配合 yield 可以实现函数的暂停和恢复,这个叫生成器

function* getResult() {
  console.log("getUserID before");
  yield "getUserID";
  console.log("getUserName before");
  yield "getUserName";
  console.log("name before");
  return "name";
}

let result = getResult();

console.log(result.next().value);
console.log(result.next().value);
console.log(result.next().value);

在生成器内部,如果遇到 yield 关键词,那么 V8yield 后面的内容返回给外部,并暂停函数的执行

生成器暂停后,外面代码开始执行,如果想要继续恢复生成器的执行,就可以使用 result.next() 方法

在暂停和恢复之间切换,这背后的原理是协程,协程是比线程更加轻量级,它是跑在线程上的任务

一个线程有多个协程,但只能执行一个协程,如果 A 协程启动 B 协程,那 A 协程就是 B 协程的父协程

使用生成器编写同步代码

function* getResult() {
  let id_res = yield fetch(id_url);
  console.log(id_res);
  let id_text = yield id_res.text();
  console.log(id_text);

  let new_name_url = name_url + "?id=" + id_text;
  console.log(new_name_url);

  let name_res = yield fetch(new_name_url);
  console.log(name_res);
  let name_text = yield name_res.text();
  console.log(name_text);
}
let result = getResult();
result
  .next()
  .value.then((response) => {
    return result.next(response).value;
  })
  .then((response) => {
    return result.next(response).value;
  })
  .then((response) => {
    return result.next(response).value;
  })
  .then((response) => {
    return result.next(response).value;
  });

把执行生成器代码的函数称为执行器(可参考著名的 co 框架)

function* getResult() {
  let id_res = yield fetch(id_url);
  console.log(id_res);
  let id_text = yield id_res.text();
  console.log(id_text);

  let new_name_url = name_url + "?id=" + id_text;
  console.log(new_name_url);

  let name_res = yield fetch(new_name_url);
  console.log(name_res);
  let name_text = yield name_res.text();
  console.log(name_text);
}
co(getResult());

async/await

async 是异步执行并隐式返回 Promise 作为结果的函数。

await 后面可以接两种类型的表达式:

  • 任何普通表达式
  • Promise 对象的表达式

如果 await 等待的是一个 Promise 对象,它会暂停执行生成器函数,直到 Promise 对象变成 resolve 才会恢复执行,然后 resolve 的值作为 await 表达式的运算结果

function NeverResolvePromise() {
  return new Promise((resolve, reject) => {});
}
function ResolvePromise() {
  return new Promise((resolve, reject) => resolve("resolve"));
}
async function getResult() {
  let a = await NeverResolvePromise();
  console.log(a); // 不会输出
}
async function getResult2() {
  let b = await ResolvePromise();
  console.log(b); // "resolve"
}
getResult();
getResult2();
console.log(0);

async 是一个异步执行的函数,不会阻塞主线程的执行

async 函数在执行时,是一个单独的协程,可以用 await 来暂停,由于等待的是一个 Promise 对象,就可以用 resolve 来恢复该协程

参考资料

  1. 学习 koa 源码的整体架构,浅析 koa 洋葱模型原理和 co 原理

20 | 垃圾回收(一):V8 的两个垃圾回收器是如何工作的?

  1. 通过 GC Root 标记内存中活动对象和非活动对象。

    • V8 采用可访问性(reachability)算法判断堆中的对象是是否为活动对象

      • GC Root 能够遍历到的对象,是可访问的(reachable),称为活动对象
      • GC Root 不能遍历到的对象,认为是不可访问的(unreachable),称为非活动对象
    • 浏览器环境中有很多 GC Root

      • window 对象(位于每个 iframe 中)
      • DOM,由可以通过遍历文档到达的所有原生 DOM 节点组成
      • 存放栈上变量
  2. 回收非活动对象所占用的内存
  3. 回收后,做内存整理(可选,有些垃圾回收器不会产生内存碎片,比如副垃圾回收器)

    • 回收结束后,内存中会出现大量不连续的空间,这空间被称为内存碎片
    • 如果内存碎片太多的话,当需要较大连续的内存时,就会出现内存不足

V8 受代际假说影响,使用了两个垃圾回收器:主垃圾回收器(Major GC),副垃圾回收器(Minor GC

代际假说:

  1. 大部分对象都是“朝生夕死”的,也就是说大部分对象在内存中存活的时间很短,比如函数内部声明的变量,或者块级作用域中的变量,当函数或者代码块执行结束时,作用域中定义的变量就会被销毁。因此这一类对象一经分配内存,很快就变得不可访问
  2. 不死的对象,会活得更久,比如:windowDOMWeb API

V8 把堆分为两个区域:

  • 新生代:存放生存时间短的对象

    • 容量小,1~8M
    • 使用副垃圾回收器(Minor GC
    • 使用 Scavenge 算法,将新生代区域分成两部分

      • 对象区域 (from-space)
      • 空闲区域 (to-space)

        1. 对象区域放新加入的对象
        2. 对象区域快满的时候,执行垃圾清理(先标记,再清理)
        3. 清理的把活动对象复制到空闲区域,并且排序(空闲区域就没有内存碎片了)
        4. 复制完之后,把对象区域和空闲区域进行翻转
        5. 重复执行上面的步骤
        6. 经过两次垃圾回收后还存在的对象,移动到老生代中
  • 老生代:存放生存时间久的对象

    • 容量大

      • 对象占用空间大
      • 对象存活时间长
    • 使用主垃圾回收器(Major GC
    • 使用标记 - 清除算法(Mark-Sweep

      • 标记:从根元素开始,找到活动对象,找不到的就是垃圾
      • 清理:直接清理垃圾(会产生垃圾碎片)
    • 或者使用标记 - 整理算法(Mark-Compact

      • 标记:从根元素开始,找到活动对象,找不到的就是垃圾
      • 整理:把活动对象向同一端移动,另一端直接清理(不会产生垃圾碎片)

参考资料

  1. Understanding Garbage Collection and hunting Memory Leaks in Node.js
  2. 深入理解 Node.js:核心思想与源码分析
  3. When and How JavaScript garbage collector works
  4. V8 引擎的内存管理
  5. Trash talk: the Orinoco garbage collector

21 | 垃圾回收(二):V8 是如何优化垃圾回收器执行效率的?

JavaScript 是运行在主线程上的,一旦执行垃圾回收算法,JavaScript 会暂停执行,等垃圾回收完毕后再恢复执行,这种行为成为全停顿(Stop-The-World

V8 团队向现有的垃圾回收器添加并行、并发、增量等垃圾回收技术

这些技术主要从两方面解决垃圾回收效率的问题:

  1. 将一个完整的垃圾回收任务拆分成多个小的任务
  2. 将标记对象、移动对象等任务转移到后端线程进行

并行回收(在主线程执行,全停顿)

在主线程执行垃圾回收的任务时,开启多个协助线程,同时执行回收工作

采用并行回收,垃圾回收所消耗的时间 = 辅助线程数 * 单个线程所消耗的时间

在执行垃圾标记的过程中,主线程不会同时执行 JavaScript 代码,因此代码不会改变回收过程

假设内存状态是静态的,因此只要确保同时只有一个辅助线程在访问对象就好了

这是 V8 副垃圾回收器采用的策略

它在执行垃圾回收的过程中,启动多个线程来负责新生代中的垃圾清理,同时将对象空间中的数据移动到空闲区域,这操作会导致数据地址变了,所以还需要同步更新这些对象的指针

增量回收(在主线程执行,穿插在各个任务之间)

将标记工作分解为更小的块,穿插在主线程不同的任务之间执行

采用增量回收,垃圾回收器没必要一次执行完成的垃圾回收流程,每次执行的只是一小部分工作

增量回收是并发的,需要满足两点要求:

  1. 垃圾回收可以随时被暂停和重启,暂停的时候需要保留扫描结果,等待下一次回收
  2. 在暂停期间,被标记好的垃圾数据,如果被修改了,垃圾回收器需要正确的处理

在垃圾回收的时候,V8 使用三色标记法:

  • 黑色:表示所有能访问到的数据(活动数据),且子节点已经都标记完成
  • 白色:表示还没有被访问到,如果在一轮遍历结束还是白色,这个数据就会被回收
  • 灰色:表示正在处理这个节点,且子节点还没被处理

垃圾回收器会根据有没有灰色的节点来判断这一轮遍历有没有结束

  • 没有灰色:一轮遍历结束,可以清理垃圾
  • 有灰色:一轮遍历还没结束,从灰色的节点继续执行

标记为黑色的数据被修改了,也就是说黑色的节点引用了一个白色的节点,但是黑色的节点是已经完成标记的,这是它后面还有一个白色的节点是不会被标记为黑色的

这就需要一个约束条件:不能让黑色节点指向白色节点

这个约束条件是:写屏障机制(Write-barrier):

  • 当发生黑色节点引用白色节点,写屏障机制会强制将这个白色节点变为灰色的,从而保证黑色节点不能指向白色节点

这种方法被称为强三色不变性

并发回收(不在主线程执行)

在主线程执行 JavaScript 时,辅助线程在后台执行垃圾回收操作

优点:主线程不会被挂起(JavaScript 可以自由执行,同时辅助线程可以执行垃圾回收)

但有两点导致它很难实现:

  1. 主线程执行 JavaScript 时,堆中的内容随时会变化,就会使得辅助线程之前的工作白做
  2. 主线程和辅助线程可能会在同一时间去修改同一个对象,这就需要额外实现读写锁的功能

《图解 Google V8》学习笔记系列

  1. 《图解 Google V8》设计思想篇——学习笔记(一)
  2. 《图解 Google V8》编译流水篇——学习笔记(二)

uccs
759 声望89 粉丝

3年 gis 开发,wx:ttxbg210604