HTTP 缓存的相关协议

上一篇文章梳理 HTTP 缓存的关键路径。浏览器发起 HTTP 请求，请求报文发往浏览器内置的缓存器，缓存器经过首次验证，再决定是否向服务器发起缓存的再次验证。这条路径的完成，依赖于 HTTP 协议。

1. 首次验证相关协议

服务器在响应报文中设置 Cache-Control 或 Expire，缓存器对资源进行缓存。
再次请求同一资源时，缓存器通过检查 Cache-Control:max-age 和 Expire，决定缓存是否过期的过程称为首次验证。

将 Cache-Control 的取值拆解为三部分，如下图

三部分都是可选的。

第一部分决定是否有缓存，或者在哪里缓存，这条指令有4个取值：

public：可以缓存，且即可本地缓存，也可以共享缓存（例如CDN）
private：可以缓存，但只允许本地缓存
no-cache：告诉客户端，不能直接使用缓存。需要经过服务器再次验证后，才决定是否使用缓存（服务器返回 304 才可用）
no-store：不允许缓存

第二部分决定缓存的有效时间，以秒为单位，有两种取值

max-age，例如 max-age=3000，即告诉客户端和共享缓存可以缓存3000秒
s-maxage，例如 s-maxage=1000，即告诉共享缓存可以缓存1000秒

第三部分控制客户端向服务器发起再次验证，它有三个取值

must-revalidate 告诉客户端必须向服务器发起再次验证，即使本地缓存还没过期（Cache-Control: max-age 或 Expire 还在有效期内）
proxy-revalidate 告诉共享缓存必须向源服务器发起再验证，即使共享缓存还未过期
immutable 指明文档是不可更改的

2. 以上都提到共享缓存，它是什么？

共享缓存相对于本地缓存，像浏览器内置缓存这种只为当前用户提供缓存服务的称为本地缓存，而像CDN这种为一个区域的用户提供缓存服务的称为共享缓存。所以 HTTP 缓存的关键路径，在上一篇文章的甚础上，加一个共享缓存。它不是必要的。

假设一个网站服务于全局的用户 U，在服务器下流有N个共享缓存，服务于N个区域的用户。补充进来之后的路径如下：

3. 举些例子

服务器在响应请求的时候，设置 Cache-Control ，不同取值含义分别是

Cache-Control: public max-age=3600 表示本地缓存和共享缓存的有效时间为3600秒。此处如果没有 public 效果一样，即在没有指明是 private 的情况下，都是 public
Cache-Control: no-cache 表示可以缓存，但使用缓存前，必须通过 ETag 或 Last-Modified 向服务器发起再验证，如果服务器响应 304 则可用，否则不可。
Cache-Control: no-store 表示不可缓存资源。
Cache-Control: max-age=3600 s-maxage=7200 表示本地缓存有效期为 3600 秒，而共享缓存是 7200 秒。

4. 浏览器通过 Cache-Control 影响缓存行为

不仅服务器可以通过 Cache-Control 影响缓存器，浏览器也可以。它的取值有no-cache、no-store、max-age max-stale 等，具体的含义不在此处细说，可查《HTTP权威指南》。

因此，Cache-Control 有双向控制缓存的能力。服务器通过响应报文设置 Cache-Control
影响怎么设置缓存；而浏览器通过请求报文设置 Cache-Control 影响怎么使用缓存。Expire 只有在响应报文中有效，其作用与
Cache-Control:max-age 一样，不同的是 max-age 是相对值，Expire 是绝对值。max-age
告诉缓存可以缓存多久（例如 3600 秒）， Expire 告诉缓存可以缓存到什么时候（例如 Sat, 29 Jul 2017
03:22:20 GMT ）

5. 服务器再验证

如果首次验证发现缓存已经超过有效期（Cache-Control:max-age 和 Expire 已经过期），此时缓存有可能依然存在，但不能直接使用。需要向服务器发请验证，由服务器决定是否可用，这个过程称为服务器再验证。

举例说明：

首次请求文件，服务器在响应报文中设置如下缓存信息，缓存器收到报文，根据 Cache-Control 和 Expire 缓存文件，记录有效期为1天。同时记录下该文件的 ETag 和 Last-Modified。

Cache-Control:max-age=86400
ETag:"597839c9-16c3"
Expires:Sat, 29 Jul 2017 03:22:20 GMT
Last-Modified:Wed, 26 Jul 2017 06:42:17 GMT

一天后，再次请求该文件，此时如果用户并非清除缓存，并且缓存还未被缓存器清除。缓存器将会检测到该请求存在缓存，但此时缓存已经超过有效期，于是在请求报文里设置 If-None-Match 和 If-Modified-Since，取值分别为该文件的 ETag 和 Last-Modified。

服务器收到报文，检测文件的上次修改时间是否与报文中的 If-Modified-Since 一样，同时检测资源的 ETag 是否与报文中的 If-None-Match 一样。如果都一样，认为缓存器的缓存仍然可以继续使用，响应 304 的状态码，缓存器收到响应后，将本地的缓存文件响应给浏览器。

请求报文如下

If-None-Match:"597839c9-16c3"
if-Modified-Since: Wed, 26 Jul 2017 06:42:17 GMT

流程图如下

HTTP 缓存的相关协议

1. 首次验证相关协议

2. 以上都提到共享缓存，它是什么？

3. 举些例子

4. 浏览器通过 Cache-Control 影响缓存行为

5. 服务器再验证

啃先生

引用和评论

时间的符号

腾讯 tRPC-Go 教学——（1）搭建服务

@tanstack/react-query 实践

腾讯 tRPC-Go 教学——（2）trpc HTTP 能力

腾讯 tRPC-Go 教学——（4）tRPC 组件生态和使用

【深度揭秘】Caffeine 缓存引发的内存泄漏全攻略：从根源到解决方案

腾讯 tRPC-Go 教学——（3）微服务间调用