头图

Memcached支持两种不同方式的客户端路由算法,即:求余数Hash算法和一致性Hash算法。下面分别进行介绍。

一、 求余数的路由算法

求余数Hash算法的客户端路由是对插入数据的键进行求余数,根据余数来决定存储到哪个Memcached实例。视频讲解如下:
https://www.bilibili.com/video/BV1qJStYqEAB/?aid=113389888084...

例如:Memcached服务器端有三台MemCached实例。那么客户端进行路由时会根据键值对3进行求余数的操作。下面的示例中的键分别为:7、6、5.

7%3=1,那么数据值路由到第2台Memcached实例。
6%3=0,那么数据值路由到第1台Memcached实例。
5%3=2,那么数据值路由到第3台Memcached实例。
提示:求余数Hash算法的客户端路由的优点在于,能够使数据均匀地分布在每个Memcached实例上。但是它也存在很大的缺点,就是当进行扩容缩容操作时,或者某个Memcached实例出现宕机的情况。该算法会出现严重的数据丢失。

下面通过一个简单的示例来说明求余数Hash算法的数据是如何丢失的。

扩容前有3个Memcached实例:7%3=1,6%3=0,5%3=2,......
扩容后有4个Memcached实例:7%4=3,6%4=2,5%4=1,......

当有3个Memcached实例时,7号键存储在第2台Memcached实例上,而扩容后变成了存储在4台Memcached实例上,其他的键以此类推。这就导致了存取的目标位置不一样,从而造成数据的丢失。

二、 一致性Hash算法

为了解决求余数Hash算法的数据丢失问题,Memcached又提出了一致性Hash算法的客户端路由。通过使用该算法能够将丢失的数据减小到最小,但不能完全解决宕机造成的数据丢失的问题。视频讲解如下:
https://www.bilibili.com/video/BV17bS3Y4EEn/?aid=113395994991...

下图展示了一致性Hash算法基本原理。
image.png

在初始的状态下有三个Memcached服务器实例,分别是:node1、node2和node3。其中:node1将保存键从1~333之间的数据值;node2将保存键从333~666之间的数据值;node3将保存键从667~1000之间的数据值。Memcached一致性Hash路由算法的扩容和缩容视频讲解如下:
https://www.bilibili.com/video/BV1qrS7YkE2s/?aid=113400776562...

下图进一步说明当Memcached集群发生扩容时数据存储位置的变化。
image.png

当Memcached集群发生故障出现宕机时,一致性Hash算法能够将丢失的数据减小到最小。如下图所示。当node3节点出现故障而宕机时,只会影响键从667~1000这部分的数据值。而存储在node1和node2上的数据将不会有任何的变化。换句话说,node3的宕机只影响了三分之一的数据。
image.png


赵渝强老师
36 声望18 粉丝

20年以上的IT行业从业经历,清华大学计算机软件工程专业毕业,京东大学大数据学院院长,Oracle中国有限公司高级技术顾问;曾在BEA、甲骨文、摩托罗拉等世界500强公司担任高级软件架构师或咨询顾问等要职,精通大...