为何在分布式环境下CAP三者不可兼得?对此问题可做棋盘推演,这样问题的关键转换为:假设存在网络分区的情形,若已得到P,即容忍网络分区的存在,那么C和A是否可以兼得。
可以分为两种情形来进行进一步推演。
情形一:如果在这个分布式系统中数据无副本,那么系统必然满足强一致性条件,因为只有独本数据,不会出现数据不一致的可能。此时C和P两要素具备,但是如果系统发生了网络分区状况或者机器宕机,必然导致某些数据不可访问,此时可用性条件是不能被满足的,即在此情形下获得了CP系统,但CAP不可同时满足。
情形二:如果系统中数据有副本(见图2-2),假设变量x存在两份副本并分别存储在不同机器上,最初数据保持一致,其值都为v1。在Time=t1的时刻,在机器1上发生对x的数值更新操作,此操作要将x的值赋为v2。时间推移到Time=t2时刻,机器1上的x已经被赋予新值v2,如果此时未发生网络分区状况,系统可以将x的新值v2同步到机器2,达到数据一致性要求。但是如果此时发生了网络分区导致两台机器无法通信,那么无法将x的新值同步到机器2,这个时刻我们不得不在C或A之间做个权衡和选择。如果希望系统高可用(选择A),那么对于读取机器2上的x的查询请求必须在限定时间内返回值,此时返回的并非是最新的值v2,所以出现了数据不一致的问题(抛弃C)。如果选择强一致性(选择C),那么在两台机器恢复通信并将数据同步到一致状态前,对于机器2的x读请求必须予以拒绝,此时无法保证系统的可用性(抛弃A)。所以不论选择哪一个,必然以牺牲另外一个因素作为代价,也就是说要么AP,要么CP,但是没有完美的CAP。


codecraft
11.9k 声望2k 粉丝

当一个代码的工匠回首往事时,不因虚度年华而悔恨,也不因碌碌无为而羞愧,这样,当他老的时候,可以很自豪告诉世人,我曾经将代码注入生命去打造互联网的浪潮之巅,那是个很疯狂的时代,我在一波波的浪潮上留下...


引用和评论

0 条评论