MySQL集群高可用架构之MHA

发布于 2019-11-24  约 18 分钟

前面写过一篇:浅谈MySQL集群高可用架构。之后一直有很多小伙伴在后台或其它渠道问我,何时有相关的深入配置管理文章出来,因此,民工哥,也将对前面的各类架构逐一进行整理,然后发布出来。那么今天将来发布的MHA的架构整体规划与配置操作。

1、架构简介

MHA(Master High Availability)目前在MySQL高可用方面是一个相对成熟的解决方案,作为MySQL高可用性环境下故障切换和主从提升的高可用软件。在MySQL故障切换过程中,MHA能做到在0~30秒之内自动完成数据库的故障切换操作,并且在进行故障切换的过程中,MHA能在最大程度上保证数据的一致性,以达到真正意义上的高可用。

该软件由两部分组成:MHA Manager(管理节点)和MHA Node(数据节点)。MHA Manager可以单独部署在一台独立的机器上管理多个master-slave集群,也可以部署在一台slave节点上。MHA Node运行在每台MySQL服务器上,MHA Manager会定时探测集群中的master节点,当master出现故障时,它可以自动将最新数据的slave提升为新的master,然后将所有其他的slave重新指向新的master。整个故障转移过程对应用程序完全透明。

目前MHA主要支持一主多从的架构,要搭建MHA,要求一个复制集群中必须最少有三台数据库服务器,一主二从,即一台充当master,一台充当备用master,另外一台充当从库,因为至少需要三台服务器。

2、布署规划

系统信息

[root@db250 ~]# cat /etc/redhat-release
CentOS release 6.8 (Final)
[root@db250 ~]# uname -r
2.6.32-642.el6.x86_64

数据库版本

mysql-5.7.17

环境规划

Db250    集群管理节点 192.168.4.250
Db251    主库  192.168.4.251
Db253    从库(备主库) 192.168.4.253
Db254    从库 192.168.4.254

架构图如下

3、配置Hosts文件

配置hosts文件

cat>>/etc/hosts<<EOF

192.168.4.250 db250

192.168.4.251 db251

192.168.4.253 db253

192.168.4.254 db254

EOF

配置完成后检查下

[root@db254 ~]# tail -4 /etc/hosts

192.168.4.250 db250

192.168.4.251 db251

192.168.4.253 db253

192.168.4.254 db254

4、SSH免密登录配置

配置SSH免密钥登陆

ssh-keygen -t rsa

ssh-copy-id 192.168.4.251

ssh-copy-id 192.168.4.253

ssh-copy-id 192.168.4.254

----以上两步配置所有服务器都需要配置

5、安装MySQL与配置主从同步

同步主库数据到从库,主从同步操作请参考之前的文章

Linux系统MySQL数据库主从同步实战过程

检查主从同步状态

mysql -uroot -p123456 -e "show slave status\G"|egrep "Slave_IO_Running|Slave_SQL_Running"

所有数据库节点配置MHA管理用户与权限

grant all on *.* to mha@'192.168.4.%' identified by '123456';

至此所有基础环境组建完成

6、安装配置MHA

https://downloads.mariadb.com... #下载地址

将相关的安装包传到其它节点

整个MHA服务安装过程如下:

安装依赖包

yum install perl-DBD-MySQL perl-Config-Tiny perl-Log-Dispatch perl-Parallel-ForkManager perl-Time-HiRes –y

管理节点安装

rpm -ivh http://dl.fedoraproject.org/pub/epel/6/x86_64/epel-release-6-8.noarch.rpm

yum localinstall -y mha4mysql-manager-0.52-0.noarch.rpm

yum localinstall -y mha4mysql-node-0.52-0.noarch.rpm

其它节点安装

yum localinstall -y mha4mysql-node-0.52-0.noarch.rpm

安装过程中可能会报错,根据提示去解决

配置过程如下:

[root@db250 ~]# mkdir /mha

[root@db250 ~]# vim /etc/masterha_default.cnf

[server default]

#刚才授权的mysql管理用戶名

user=mha

password=123456

manager_workdir=/mha

manager_log=/mha/manager.log

remote_workdir=/mha

#ssh免密钥登录的帐号名

ssh_user=root

#mysql复制帐号,用来在主从机之间同步二进制日志等

repl_user=slave

repl_password=123456

#ping间隔,用来检测master是否正常

ping_interval= 1

[server1]

hostname=db251

master_binlog_dir=/var/lib/mysql

#候选master挂掉时候优先让它顶

candidate_master=1

[server2]

hostname=db253

master_binlog_dir=/var/lib/mysql/

candidate_master=1

[server3]

hostname=db254

master_binlog_dir=/var/lib/mysql/

no_master=1

#不能成为master

------相关的检测命令如下------------------

masterha_check_ssh 检查MHA的SSH配置状况
masterha_check_repl 检查MySQL复制状况
masterha_manger 启动MHA
masterha_check_status 检测当前MHA运行状态
masterha_master_monitor 检测master是否宕机
masterha_master_switch 控制故障转移(自动或者手动)
masterha_conf_host 添加或删除配置的server信息

检测SSH免密登录

检测同步

7、启动MHA服务

[root@db250 ~]# masterha_manager --conf=/etc/masterha_default.cnf &

[1] 2035Fri Sep  1 01:52:25 2017 - [info] Reading default configuratoins from /etc/masterha_default.cnf..

Fri Sep  1 01:52:25 2017 - [info] Reading application default configurations from /etc/masterha_default.cnf..

Fri Sep  1 01:52:25 2017 - [info] Reading server configurations from /etc/masterha_default.cnf..

查看启动日志

从启动日志也可以看出目前的DBmaster是DB251这台服务器,说明启动成功。

8、测试故障自动切换

接下来模拟下故障,将db251关闭


[root@db251 ~]# /etc/init.d/mysqld stop

Stopping mysqld:       [  OK  ]

查看日志

发现新的主库已切换到db253这台服务器上了,接下来查看下主从同步的情况。

当原来的主服务器故障修复后,需要手工将原主变成从

[root@db250 ~]# grep -i"All other slaves should start" /mha/manager.log

Fri Sep  1 01:59:05 2017 - [info]  All other slaves should start replicationfrom here. Statement should be: CHANGE MASTER TO MASTER_HOST='db253 or192.168.4.253', MASTER_PORT=3306,MASTER_LOG_FILE='slave-bin.000003',MASTER_LOG_POS=760546, MASTER_USER='slave', MASTER_PASSWORD='xxx';

发现原来的主库修复上线后成为了新的从库,然后同DB253进行同步

测试主写同步情况

同步正常

点击-->民工哥技术之路 关注微信公众号,对话框回复关键字:1024 可以获取一份最新整理的 2048G 技术干货:包括系统运维、数据库、redis、MogoDB、电子书、Java基础课程、Java实战项目、架构师综合教程、架构师实战项目、大数据、Docker容器、ELK Stack、机器学习、BAT面试精讲视频等。

阅读 973发布于 2019-11-24

推荐阅读
民工哥技术之路
用户专栏

分享高可用、高并发、架构技术,偶尔聊聊职场。

10176 人关注
94 篇文章
专栏主页
目录