SRE随笔---CAP和BASE理论

问题背景

高可用的通用设计方法是冗余设计，通过多个节点形成集群来提供服务。然而一旦使用集群，必然要涉及到集群的一致性、可用性、分区容错性等问题，也就是CAP理论。

CAP理论

分布式集群的CAP理论通常包含以下三个元素：
C：一致性
指一个服务集群中的所有节点的数据同一时刻必须具有同样的值。例如一个存储集群有a，b，c三个节点组成，如果从a节点写入一个数据，而从a, b，c节点能够同时读到该数据的值，并且一致，我们就认为这个集群是数据一致的。相反如果a节点能读到该数据，而b，c节点暂时读不到，我们就认为集群数据不一致(可能是网络或其他原因导致a的数据没有同步到b，c节点)

A：可用性
处于工作状态的集群节点能在合理的时间内返回合理的响应。例如节点总是能够在超时时间内返回一个预期的结果，不会长时间的等待或阻塞

P：分区容错性
分区是指集群中的节点之间因为网络故障无法通信，导致集群被划分成了多个网络分区(分区内的节点可以正常通信，但是分区之间网络不通)。针对这种常见情况，需要确保此时的集群不出现混乱，依然能够对外提供服务，即分区容错性

CAP三个关键属性通常不能在设计系统时完全满足，有时候需要做一下取舍，牺牲一部分某属性来换取或提升其他两个属性：
例如下面的一些使用场景：

BASE理论

在大部分场景中，可用性的重要程度比一致性更高，因此出现了BASE理论。
BA： 基本可用，常见方法有流量削峰，延迟响应，降级
S：软状态，指一种过渡状态，即不同节点间，数据副本可能存在短暂的不一致
E：最终一致性，在时间窗口内，这些软状态会消失，达到一致性

BASE理论时对CAP的一致性和可用性进行权衡的结果。核心思想是：虽然无法做到强一致，但服务可以根据自身的业务特点，采取适当的方式保证最终的一致性。

因为如果要保证强一致性，必然涉及到节点之间的状态和数据同步，服务之间的调用和事务执行。耗时也会随着节点和数据的增加而变长，资源因此而阻塞，无法应对高并发和大流量。所以我们退而求其次，不追求强一致，而确保最终一致(例如在某个时间范围内，集群中的节点状态能够达到一致性)

SRE随笔---CAP和BASE理论

问题背景

CAP理论

BASE理论

千里之行

引用和评论

云管平台的建设要点

k8s集群部署（一主两从）

AD系列：Windows Server 2025 搭建AD域控和初始化

一体化运维，降本增效！秒云助力某基金打造智能运维平台

k8s实战基础

HTTP500代码怎么解决？常见的5xx网页错误及其原因

linux运维之NFS