在追求极致性能和高可用性的数据库领域,OceanBase 以其分布式架构、强一致性和金融级稳定性赢得了众多企业的青睐。那么,在使用OceanBase 的第一步——安装部署有哪些关键步骤呢?
《DBA从入门到实践》第二期将分享 OceanBase的安装部署和集群的基础使用,包括一些不可不知的关键步骤和常见失误与解决方案。本期我们将了解到:
- 安装生产环境需要提前准备哪些工作?
- 多种安装部署工具如何选择?
- 每种安装部署工具使用有哪些注意事项?
- 如何查看集群的资源和已有租户分配的资源详情?
- 租户的创建和访问及其注意事项有哪些?
- 为什么有了参数还需要变量,参数和变量使用时有哪些区别?
敬请关注4月10日(周三)教程直播,扫描下方二维码报名学习。
内容抢 “鲜” 知
(一)多种安装部署工具如何选择
在OceanBase 生态体系中,除了数据库内核,还有很多功能强大的周边工具,实现不同的功能,比如:
- 安装部署工具OBD(OceanBase Deployer)
- 运维管理工具OCP(OceanBase Cloud Platform)
- OceanBase K8s 运维工具ob-operator
对于企业用户而言,OCP 拥有丰富的运维功能,便于在集群增多后做更细致的运维管理;个人用户更适合使用OBD,支持纯黑屏操作, 对资源消耗最少;对于 k8s 的开发者,ob-operator 延续了k8s开发者的使用习惯,用以管理 OceanBase 数据库。
以上三款工具的特性支持对比见下图,了解各工具的功能和特点后,我们就可以结合自己的场景需求选择合适的工具部署 OceanBase 环境。
还未安装部署OceanBase的同学,建议跳转至「快速上手」页面体验一键部署,有疑问可在教程直播Q&A环节在线提问。本文以介绍使用广泛的OCP工具以抛砖引玉,其他工具的详细介绍将在本期教程分享给大家。
(二)如何通过 OCP 部署生产集群
OCP作为OceanBase 数据库集群量身打造的企业级管理平台,兼容 OceanBase 所有主流版本,拥有丰富且完善的运维功能。OCP 提供对 OceanBase 集群的图形化管理能力,包括数据库组件及相关资源(主机、网络和软件包等)的全生命周期管理、故障恢复、性能诊断、监控告警等,旨在协助客户更加高效地管理 OceanBase 集群,降低企业的 IT 运维成本和用户学习成本。
从下图可以看到,通过OCP部署 OceanBase 集群,只需简单几步,且都是白屏化操作,对用户而言,安装部署变得简单,任务实时可见,非常友好,
(三)安装部署避坑指南
而在部署过程中,我们经常收到“部署意外”反馈,究其原因,是忽略了一些关键步骤导致的。但这一个个“意外” 往往成为顺畅完成部署和使用的拦路虎。我们整理了一份安装部署常见失误及解决方案,如下。
- 生产环境 data 和 clog 强烈建议分盘部署,原因是目前 clog 和 sstable 之间没有做 iops隔离,影响性能。
- 如果后续有通过 NFS 作为备份介质的需求,启动observer的用户和组 id 整个集群内的节点上必须一致,否则会出现备份延迟,排查时会看到 nfs 可能没有挂载或者权限( Permission denied )有问题。
- 集群环境必须配置时钟同步,且各节点之间的时钟延迟不能超过2秒,否则可能影响 OceanBase 集群的选举模块,导致出现无主的情况发生。
- OBD高危命令要注意:destory/redeploy/reinstall ,比如修改部分配置后会提示 redeploy和对应的影响,如果没有了解到,贸然执行,结果就是对应的 OceanBase 集群重新部署了,上面的数据也会被删除。
- obd 命令中指定的是deploy_name,和 yaml文件中对应的 appname 没有强关联(名字可以相同也可以不同),但是appname需要和对应的obproxy-ce组件中(如果有)cluster_name保持一致。
- OBD部署时 oceanbase-ce 组件中的 proxyro_password 和 obproxy-ce 组件中的 obproxy_sys_password 需要保持一致。
- OBD维护的 OceanBase 集群如果先通过sql命令行调整的配置,再执行 obd stop,最后执行 obd start 会出现配置"丢失“的现象。因此,如果OBD中存在的配置,使用obd edit-config的方式调整,如果已经执行过sql命令,obd start 时需要不带参启动,即加上 --wop 的选项。
- 安装部署阶段如果在 bootstrap 时失败,需要先排查日志进行处理,该步骤不能重试,需铲掉后重新部署。
- datafile_size 和 datafile_disk_percentage 配置只能调大,不允许调小,且是与分配资源的,需要提前根据实际监控告警的阈值进行调整,避免部署集群后还没有业务数据就开始报容量相关的告警。
更多部署关键路径和避坑指南会在4月10日《DBA从入门到实践》第二期教程中逐一揭晓,扫描下方海报预约直播吧~
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。