2
头图

欢迎加入人类高质量前端框架研究群,带飞

大家好,我卡颂。

React源码内部在实现不同模块时用到了多种算法与数据机构(比如调度器使用了小顶堆)。

今天要聊的是数据缓存相关的LRU算法。内容包含四方面:

  • 介绍一个React特性
  • 这个特性和LRU算法的关系
  • LRU算法的原理
  • ReactLRU的实现

可以说是从入门到实现都会讲到,所以内容比较多,建议点个赞收藏慢慢食用。

一切的起点:Suspense

React16.6引入了SuspenseReact.lazy,用来分割组件代码。

对于如下代码:

import A from './A';
import B from './B';

function App() {
  return (
    <div>
      <A/>
      <B/>
    </div>
  )
}

经由打包工具打包后生成:

  • chunk.js(包含A、B、App组件代码)

对于首屏渲染,如果B组件不是必需的,可以将其代码分割出去。只需要做如下修改:

// 之前
import B from './B';
// 之后
const B = React.lazy(() => import('./B'));

经由打包工具打包后生成:

  • chunk.js(包含A、App组件代码)
  • b.js(包含B组件代码)

这样,B组件代码会在首屏渲染时以jsonp的形式被请求,请求返回后再渲染。

为了在B请求返回之前显示占位符,需要使用Suspense

// 之前,省略其余代码
return (
  <div>
    <A/>
    <B/>
  </div>
)
// 之后,省略其余代码
return (
  <div>
    <A/>
    <Suspense fallback={<div>loading...</div>}>
      <B/>
    </Suspense>
  </div>
)

B请求返回前会渲染<div>loading.。.</div>作为占位符。

可见,Suspense的作用是:

在异步内容返回前,显示占位符(fallback属性),返回后显示内容

再观察下使用Suspense后组件返回的JSX结构,会发现一个很厉害的细节:

return (
  <div>
    <A/>
    <Suspense fallback={<div>loading...</div>}>
      <B/>
    </Suspense>
  </div>
)

从这段JSX中完全看不出组件B是异步渲染的!

同步和异步的区别在于:

  • 同步:开始 -> 结果
  • 异步:开始 -> 中间态 -> 结果

Suspense可以将包裹在其中的子组件的中间态逻辑收敛到自己身上来处理(即Suspensefallback属性),所以子组件不需要区分同步、异步。

那么,能不能将Suspense的能力从React.lazy(异步请求组件代码)推广到所有异步操作呢?

答案是可以的。

resource的大作为

React仓库是个monorepo,包含多个库(比如reactreact-dom),其中有个和Suspense结合的缓存库 —— react-cache,让我们看看他的用处。

假设我们有个请求用户数据的方法fetchUser

const fetchUser = (id) => {
  return fetch(`xxx/user/${id}`).then(
    res => res.json()
  )
};

经由react-cachecreateResource方法包裹,他就成为一个resource(资源):

import {unstable_createResource as createResource} from 'react-cache';

const userResource = createResource(fetchUser);

resource配合Suspense就能以同步的方式编写异步请求数据的逻辑:

function User({ userID }) {
  const data = userResource.read(userID);
  
  return (
    <div>
      <p>name: {data.name}</p>
      <p>age: {data.age}</p>
    </div>
  )
}

可以看到,userResource.read完全是同步写法,其内部会调用fetchUser

背后的逻辑是:

  1. 首次调用userResource.read,会创建一个promise(即fetchUser的返回值)
  2. throw promise
  3. React内部catch promise后,离User组件最近的祖先Suspense组件渲染fallback
  4. promise resolve后,User组件重新render
  5. 此时再调用userResource.read会返回resolve的结果(即fetchUser请求的数据),使用该数据继续render

从步骤1和步骤5可以看出,对于一个请求,userResource.read可能会调用2次,即:

  • 第一次发送请求、返回promise
  • 第二次返回请求到的数据

所以userResource内部需要缓存该promise的值,缓存的key就是userID

const data = userResource.read(userID);

由于userIDUser组件的props,所以当User组件接收不同的userID时,userResource内部需要缓存不同userID对应的promise

如果切换100个userID,就会缓存100个promise。显然我们需要一个缓存清理算法,否则缓存占用会越来越多,直至溢出。

react-cache使用的缓存清理算法就是LRU算法。

LRU原理

LRU(Least recently used,最近最少使用)算法的核心思想是:

如果数据最近被访问过,那么将来被访问的几率也更高

所以,越常被使用的数据权重越高。当需要清理数据时,总是清理最不常使用的数据。

react-cache中LRU的实现

react-cache的实现包括两部分:

  • 数据的存取
  • LRU算法实现

数据的存取

每个通过createResource创建的resource都有一个对应map,其中:

  • mapkeyresource.read(key)执行时传入的key
  • mapvalueresource.read(key)执行后返回的promise

在我们的userResource例子中,createResource执行后会创建map

const userResource = createResource(fetchUser);

userResource.read首次执行后会在该map中设置一条userIDkeypromisevalue的数据(被称为一个entry):

const data = userResource.read(userID);

要获取某个entry,需要知道两样东西:

  • entry对应的key
  • entry所属的resource

LRU算法实现

react-cache使用双向环状链表实现LRU算法,包含三个操作:插入、更新、删除。

插入操作

首次执行userResource.read(userID),得到entry0(简称n0),他会和自己形成环状链表:

此时first(代表最高权重)指向n0

改变userID props后,执行userResource.read(userID),得到entry1(简称n1):

此时n0n1形成环状链表,first指向n1

如果再插入n2,则如下所示:

可以看到,每当加入一个新entryfirst总是指向他,暗含了LRU中新的总是高权重的思想。

更新操作

每当访问一个entry时,由于他被使用,他的权重会被更新为最高。

对于如下n0 n1 n2,其中n2权重最高(first指向他):

当再次访问n1时,即调用如下函数时:

userResource.read(n1对应userID);

n1会被赋予最高权重:

删除操作

当缓存数量超过设置的上限时,react-cache会清除权重较低的缓存。

对于如下n0 n1 n2,其中n2权重最高(first指向他):

如果缓存最大限制为1(即只缓存一个entry),则会迭代清理first.previous,直到缓存数量为1。

即首先清理n0

接着清理n1

每次清理后也会将map中对应的entry删掉。

完整LRU实现见react-cache LRU

总结

除了React.lazyreact-cache能结合Suspense,只要发挥想象力,任何异步流程都可以收敛到Suspense中,比如React Server Compontnt流式SSR

随着底层React18在年底稳定,相信未来这种同步写法的开发模式会逐渐成为主流。

不管未来React开发出多少新奇玩意儿,底层永远是这些基础算法与数据结构。

真是朴素无华且枯燥......


卡颂
3.1k 声望16.7k 粉丝