主要观点:Atlassian 近期将 400 万 Jira 数据库迁移至 Amazon Aurora,以降低成本并提升 Jira Cloud 平台的可靠性,因涉及文件数量大及托管服务限制,开发了自定义工具来协调迁移过程,文中描述了技术挑战及成果。
关键信息:
- Atlassian 架构中每个租户对应一个数据库,共 400 多万个 PostgreSQL 数据库。
- 2023 年底决定将整个舰队重平台至 Amazon Aurora,目标是利用其更好的 SLA、自动扩展读取实例提升弹性及实现成本优化。
- 项目预计数月,利用 AWS Step Functions 协调,靠功能标记覆盖应用服务器上的租户数据库端点,单个数据库对应磁盘约 5000 个文件,因文件数量大导致 Aurora 出现新副本实例超时等问题,采用“引流”方式协调迁移,控制实例上的租户和跨集群移动的数据库数量。
- 迁移高峰时每天最多迁移 90000 个 Jira 数据库,平均 38000 个,整个项目涉及 2403 个 RDS 数据库实例,迁移 260 万个数据库,从源实例引流 180 万个数据库,估计 Jira 中使用的数据库文件总数超过 274 亿,但未披露成本节约的其他指标和细节。
重要细节: - Pat Rubis 解释了每个租户一个数据库架构的原因,可最大化隔离、可扩展性和操作控制。
- 转换 Amazon RDS for PostgreSQL 实例到 Aurora 通常简单,但每个实例的大量数据库需同时切换,且存在 startup timeout 阈值未在 Amazon Aurora 配额和约束页面记录的问题。Cassian Cox 称这是一项重大基础设施工作,带来了可扩展性、可靠性和成本效率的提升。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。