服务降级、限流、熔断详解

今夜有点儿凉

2 月 26 日北京

阅读 2 分钟

0

服务降级、服务限流和服务熔断是分布式系统中常用的容错和稳定性保障手段，它们的核心目标是在高并发、故障或资源不足时确保系统核心功能的可用性。以下是它们的定义、区别及使用场景：

1. 服务降级（Service Degradation）

定义：在系统资源紧张时，暂时关闭非核心服务或功能，优先保障核心业务的可用性。服务降级可以是主动策略（如大促前预设）或被动触发（如系统负载过高）。
使用场景：
- 高并发场景（如双十一、秒杀），牺牲次要功能（如商品评论、个性化推荐）以释放资源。
- 依赖的外部服务不可用时，降级为默认值或简化流程（如用缓存数据替代实时查询）。
实现方式：手动配置开关，或结合熔断器自动触发。

示例：电商网站在流量高峰时关闭用户积分兑换功能，确保下单支付流程正常。

2. 服务限流（Service Rate Limiting）

定义：通过限制请求的速率或并发数，防止系统因突发流量过载。超过阈值的请求会被拒绝、排队或降级处理。
常用算法：
- 计数器：固定时间窗口统计请求数。
- 滑动窗口：更平滑的时间窗口统计。
- 漏桶算法：以恒定速率处理请求，超出则丢弃。
- 令牌桶：允许一定程度的突发流量（如每秒生成100个令牌，请求需获取令牌才能执行）。
使用场景：
- 防止接口被恶意刷量或突发流量压垮系统（如API网关限流）。
- 资源敏感型服务（如数据库连接池限制最大连接数）。

示例：秒杀系统中，每秒仅允许前1000个请求进入下单流程，其余返回“稍后再试”。

3. 服务熔断（Service Circuit Breaker）

定义：当某个依赖服务故障（如超时或错误率飙升），熔断器会快速断开对该服务的调用，避免资源耗尽引发雪崩。熔断后进入“半开状态”试探恢复。
熔断三态：
- Closed：正常调用。
- Open：直接拒绝请求，不调用故障服务。
- Half-Open：尝试放行部分请求，检测服务是否恢复。
使用场景：
- 依赖的第三方服务不稳定（如支付接口超时）。
- 防止故障扩散到整个系统（如微服务链中某个节点故障）。

示例：订单服务调用支付服务时，若连续5次超时，熔断器触发，后续请求直接返回“支付暂不可用”，10秒后尝试恢复。

三者的区别与联系

维度	服务降级	服务限流	服务熔断
核心目标	保障核心功能可用	控制流量进入速度	快速失败，避免雪崩
触发条件	资源不足或主动降级	流量超过阈值	依赖服务故障（如错误率超限）
实现方式	关闭非核心功能或简化逻辑	限制请求速率/并发数	熔断器状态机控制
典型工具	Hystrix、Sentinel	Sentinel、Nginx限流模块	Hystrix、Resilience4j

何时使用？

服务降级：系统资源紧张、依赖服务不可用，需优先保障核心链路。
服务限流：预期或突发的流量高峰，需防止系统过载。
服务熔断：依赖服务持续故障，需避免连锁故障（雪崩效应）。

总结

三者常结合使用，例如：

网关层通过限流控制入口流量；
微服务调用中，对故障服务触发熔断，并降级为备用逻辑；
最终在系统层面实现高可用。
这些机制在微服务架构（如Spring Cloud Alibaba Sentinel、Hystrix）中尤为重要，是构建弹性系统的基石。

spring-cloud sentinel hystrix

阅读 750发布于 2 月 26 日

今夜有点儿凉

40 声望3 粉丝

今夜有点儿凉，乌云遮住了月亮。

« 上一篇

MySQL底层是如何实现事物的四大特性的？

下一篇 »

Spring Cloud 和 Dubbo 区别

引用和评论

推荐阅读

什么是阻塞队列？

今夜有点儿凉阅读 563

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。