第14问:在 MGR 集群里,一个节点异常退出后,会发生什么?

爱可生云数据库

一问一实验 头图.png

本文关键字:MGR、监控、Wireshark

问题

在一个 MGR 集群里,一个节点异常退出后,MySQL 会如何进行调度?异常的节点什么时候会被踢出集群?

实验

实验开始前,给大家分享一个小经验:选择合适的观测工具,如果没有,就创造一个。

我们先使用三台虚拟机,创建一个 MGR 的集群。MySQL 的版本是 5.7.20(之所以使用低版本的 MySQL,因为恐怕没有人能说清楚这个低版本的 MGR 的行为,不能扯淡只能观测)。

这次我们忽略这一操作步骤,只看一下创建好的集群:

1.png

检查一下谁是 Primary:

2.png

现在我们得选择一个观测工具了。我们知道 MGR 需要通过网络来相互沟通,对集群内的节点状况达成一致。通过抓包对 MGR 的行为进行分析,看上去是个不错的主意。

不过 Wireshark 并不支持分析 MGR 的网络协议,我们只能自己创造一个 Wireshark 的分析插件(dissector)。

此处我们忽略创造插件的过程,直接拿来用就可以了。

我们访问:

https://github.com/actiontech...

下载 Wireshark 的安装包,并安装好:

3.png

我们在 MGR 的 Primary 节点(test-mgr-1)上抓包:

4.png

然后将一个节点(test-mgr-3)干掉:

5.png

我们用刚安装的 Wireshark 打开抓包的文件 test-mgr-1.cap,并使用 MGR 协议解开抓包:

6.png

效果如图:

7.png

我们现在为 Wireshark 的列表增加一列,将 MGR 的信息类型显示出来:

8.png

9.png

这一列的公式为:mgr.app_data.body.cargo_type

这样我们就能看到 MGR 的信息类型:

10.png

现在我们通过过滤公式,找到特定类型的 MGR 信息:

11.png

可以看到 MGR 的 Primary(10.186.61.45,也就是 test-mgr-1)向另一个存活节点(10.186.61.71,也就是 test-mgr-2)发送了三个信息,分别是 view_msg,remove_node_type,view_msg。我们仔细看看这三个包的详细信息:

12.png

第一个包,是 Primary 发出的 view 信息(view 是 MGR 的各个节点的状态),可以看到这个 view 的信息是:第一个节点在线,第二个节点在线,第三个节点离线。

13.png

第二个包是删除节点的通知,Primary 通知其他节点,将删除离线的节点三。

14.png

第三个包是一秒之后发送的,Primary 通知其他节点新的 view 是什么样的:新的 view 只有两个节点了。

通过抓包,我们看到了 MGR 各个节点间的信息交换,借此理解 MGR 节点间的调度行为。

在一个节点崩溃后,Primary 节点很快就向全员更新了某节点离线的信息。然后将其踢出集群,并将决定通知全员。

希望我们创造的这个 Wireshark 插件,可以帮助大家理解 MGR 的调度行为,也欢迎大家提需求或缺陷。


关于 MySQL 的技术内容,你们还有什么想知道的吗?赶紧留言告诉小编吧!
黄炎自媒体.png

阅读 1.8k

中国领先的企业数据处理技术整体解决方案提供商,开源数据库领域优秀企业。为大型行业用户的特定场景提...

196 声望
138 粉丝
0 条评论
你知道吗?

中国领先的企业数据处理技术整体解决方案提供商,开源数据库领域优秀企业。为大型行业用户的特定场景提...

196 声望
138 粉丝
宣传栏