4

CAP 是分布式数据库中的重要理论之一。为了更好的理解分布式数据库,我们需要对 CAP 理论有个简单的理解。

1.CAP 概述

CAP 证明了,对于一个分布式数据库系统,存在这样三个指标:

  • C_onsistent_(一致性。写操作是 原子 的,当写操作完成后,所有后续的读取操作获取得到的都必须是新值),
  • A_vailable_(可用性。只要还有一个节点服务器在运行,整个系统对于请求总是要返回结果)
  • P_artition tolerant_(分区容忍性。当节点服务器之间的通信中断后,即:出现网络分区,整个系统还是能提供服务的)。

而你只能在这三个指标中同时照顾好两个。

根据 CAP 理论,当你在设计/使用分布式数据库时,你需要做出选择:在 Consistent, Available, Partition tolerant 中放弃什么。

Partition tolerant 是个架构选择(数据库是否是分布式),所以一般而言,你需要选择是更在意 Consistent 还是 Available。

理解 CAP 理论对于做出正确的选择是至关重要的。

2.CAP 小故事

为了更好地理解 CAP,这里以现实生活中的例子做个类比

假设这个世界是一个巨大的分布式系统,关于暴走漫画的知识是系统中存储的数据,暴漫的粉丝是这个分布式系统中的一个个节点。

假设今天你刚刚看了最新一期暴走大事件(第三季43集),而今天的日期是 2015年4月18日,突然有一伙儿神秘人闯进你家门,把你抓到了深山里,让你参与建造方舟,并且与世隔绝。

时光如梭,一转眼 5 年过去了,到了 2020年1月2日。方舟建成,你被送回了家乡。在回家的路上,你遇到一个路人,问了你一个问题:

暴走大事件最新一期是第几季第几集了?

这时候,你需要做一个选择:

你可以回答你知道的最新一期(第三季43集,5年前的最新一期)。如果你选择回答,那你就是 Available 的。或者你可以选择不回答,因为你已经与世隔绝了 5 年,你知道你的答案很可能和世界上其余暴漫粉丝的答案不一致(Consistent),这样这个路人得不到答案,但是整个世界是 Consistent 的。

即:你可以选择确保路人能得到答案(Available),或者确保世界的一致性(Consistent)。


Michael_Ding
1.1k 声望79 粉丝

开源爱好者,技术爱好者,爱动手,爱实践