CAP 是分布式数据库中的重要理论之一。为了更好的理解分布式数据库,我们需要对 CAP 理论有个简单的理解。
1.CAP 概述
CAP 证明了,对于一个分布式数据库系统,存在这样三个指标:
-
C_onsistent_(一致性。写操作是
原子
的,当写操作完成后,所有后续的读取操作获取得到的都必须是新值), - A_vailable_(可用性。只要还有一个节点服务器在运行,整个系统对于请求总是要返回结果)
- P_artition tolerant_(分区容忍性。当节点服务器之间的通信中断后,即:出现网络分区,整个系统还是能提供服务的)。
而你只能在这三个指标中同时照顾好两个。
根据 CAP 理论,当你在设计/使用分布式数据库时,你需要做出选择:在 Consistent, Available, Partition tolerant 中放弃什么。
Partition tolerant 是个架构选择(数据库是否是分布式),所以一般而言,你需要选择是更在意 Consistent 还是 Available。
理解 CAP 理论对于做出正确的选择是至关重要的。
2.CAP 小故事
为了更好地理解 CAP,这里以现实生活中的例子做个类比
假设这个世界是一个巨大的分布式系统,关于暴走漫画的知识是系统中存储的数据,暴漫的粉丝是这个分布式系统中的一个个节点。
假设今天你刚刚看了最新一期暴走大事件(第三季43集),而今天的日期是 2015年4月18日
,突然有一伙儿神秘人闯进你家门,把你抓到了深山里,让你参与建造方舟,并且与世隔绝。
时光如梭,一转眼 5 年过去了,到了 2020年1月2日
。方舟建成,你被送回了家乡。在回家的路上,你遇到一个路人,问了你一个问题:
暴走大事件最新一期是第几季第几集了?
这时候,你需要做一个选择:
你可以回答你知道的最新一期(第三季43集,5年前的最新一期)。如果你选择回答,那你就是 Available
的。或者你可以选择不回答,因为你已经与世隔绝了 5 年,你知道你的答案很可能和世界上其余暴漫粉丝的答案不一致(Consistent
),这样这个路人得不到答案,但是整个世界是 Consistent
的。
即:你可以选择确保路人能得到答案(Available),或者确保世界的一致性(Consistent)。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。