分布式系统架构5：限流设计模式

这是小卷对分布式系统架构学习的第5篇文章，今天来学习限流器和限流设计模式

1.为什么要限流？

任何一个系统的运算、存储、网络资源都不是无限的，当系统资源不足以支撑外部超过预期的突发流量时，就应该要有取舍，建立面对超额流量自我保护的机制，而这个机制就是微服务中常说的“限流”

2.四种限流设计模式

说到限流，大家直接的想法就是Sentinel，但是Sentinel限流的原理可能很多人没去深入理解，或者限流到底是怎么做的？具体如何进行限流，业界内也有一些常见设计模式。

2.1流量计数器模式

流量计数器是一种最简单的限流方式，通过记录固定时间窗口内的请求次数来判断是否达到限流阈值。如果请求次数超过限制值，则拒绝后续请求。

实现方式：

将时间划分为固定的时间窗口（如 1 秒、1 分钟）。
每个窗口维护一个计数器，记录当前时间窗口内的请求次数。
如果计数器值超过限流阈值，直接拒绝请求；否则增加计数器。

固定窗口边界问题：

在窗口边界的两端，可能存在短时间内超量请求的“临界问题”

比如场景设定：一秒内的TPS大于80时，就限流。

存在问题：即使每一秒的统计流量都没有超过 80 TPS，也不能说明系统没有遇到过大于 80 TPS 的流量压力。比如说系统在连续2秒内都收到60TPS的请求，但是请求发生的时间分别在第1秒的后0.5秒，以及第2秒的前0.5秒。这样系统实际曾在1秒内发生超过80 TPS的请求。

即使连续若干秒统计流量超过阈值，也不能说明流量压力一定超过系统承受能力

假设 10 秒的时间片段中，前 3 秒的 TPS 平均值到了 100，而后 7 秒的平均值是 30 左右，此时系统是否能够处理完这些请求而不产生超时失败？答案是可以的

存在缺陷：造成上面2个问题得原因是流量计数器模式是对时间点进行离散的统计

2.2滑动窗口模式

概念：时间轴上，一个固定大小的窗口随时间平滑滚动。任何时刻，静态地通过窗口内观察到的信息，都等价于一段长度与窗口大小相等的信息。主要是通过记录多个较小时间窗口（子窗口）的请求次数，实现更精细化的限流控制。

假设：准备观察的时间片段为 10 秒，以 1 秒作为统计精度，那可以得到一个长度为 10 的数组。设定限流阈值是最近 10 秒内收到的请求不超过 500 个，那么就需要统计10个子数组的请求总数，是否超过阈值。

优点：

解决了固定窗口边界问题

缺点：

只适用于否决式限流，超过阈值的流量就必须失败

2.3漏桶模式

漏桶可以简单的理解：小学水池应用题，一个水池，每秒以 X 升速度注水，同时又以 Y 升速度出水，问水池啥时候装满。

概念：将请求视为流入漏桶的水，漏桶以固定速率“漏水”。当请求流量超过漏桶的处理能力时，多余的请求会被丢弃或排队。其核心思想是平滑请求流量

实现方式：

维护一个队列（或计数器），用来模拟漏桶。
新请求到来时，将请求放入桶中。
按固定速率处理桶中的请求。
如果桶已满，则拒绝新请求。

缺点：

比较难确定桶的大小和水流出的速度

2.4令牌桶算法

和漏桶一样是基于缓冲区的限流算法，简单理解就是去银行办事时在排队机号取号的场景。

概念：通过固定速率向桶中添加令牌，请求到来时需要先消耗令牌才能被处理。如果桶中没有足够的令牌，请求会被拒绝。与漏桶算法不同，令牌桶允许一定的突发流量。

实现方式

维护一个桶，桶中存储令牌。
按固定速率（比如限流是1秒100次请求，那么间隔10ms时间放入令牌）向桶中添加令牌，直到桶满为止。
请求到来时从桶中取出令牌，如果没有令牌就马上失败或者进入降级逻辑。

实际开发的时候，不需要专门做放令牌到桶里这件事，只需要在获取令牌前，比较一下时间戳与当前时间，就能算出需要放入多少令牌，下面是示例代码：

private long lastTime = System.currentTimeMillis();
private int tokens = 0; // 当前令牌数
private static final int LIMIT = 100; // 桶容量
private static final int REFILL_RATE = 10; // 令牌添加速率（令牌/秒）

public synchronized boolean tryAcquire() {
    long now = System.currentTimeMillis();
    // 添加令牌
    tokens = Math.min(LIMIT, tokens + (int) ((now - lastTime) / 1000) * REFILL_RATE);
    lastTime = now;

    if (tokens > 0) {
        tokens--;
        return true;
    }
    return false;
}

3.分布式限流

上面介绍的4种限流算法都只适用于单机限流，或者把系统当做整体来限流。实际应用中仍然需要精细的每个服务的限流。

概念：过将限流逻辑分散到多个节点，同时使用一致性算法保证全局限流的一致性。它结合了本地限流和集中式限流的优点。

实现方式

基于 Redis + Lua 脚本
- 使用 Redis 脚本实现分布式限流，在 Redis 中存储全局的请求计数器
基于一致性算法
- 使用分布式一致性算法（如 Raft、Paxos）维护全局流量状态
分布式网关
- 通过 API 网关（如 Kong、Nginx、Spring Cloud Gateway）实现流量的统一调度和限流。

缺点：

实现复杂度高，且网络通信和一致性操作带来额外延迟。当流量大时，限流本身会降低系统处理能力

总结

今天学习了4种限流设计模式：流量计数器模式、滑动窗口模式、漏桶模式、令牌桶模式，后面2种都是基于缓冲区的限流算法。简单了解了下分布式限流的概念。限流本身是有代价的，实际开发中需要权衡方案的代价和收益。后续有时间补充Sentinel的限流原理和其中用了哪些设计模式。

分布式系统架构5：限流设计模式