本文介绍了某超大型保险公司于 2023 年 11 月成功投产的全新核心保单系统,这是保险业首次采用全栈自主技术的核心业务系统。通过系统升级,该公司实现了从集中式到分布式架构的转变,借助国产 X86 服务器和 TiDB 分布式数据库显著提升了性能,为未来业务增长奠定了坚实基础。这一创新不仅在逻辑大集中的核心系统领域确立了新的标杆,同时也为金融行业关键系统的国产化建设提供了宝贵经验。

2023 年 11 月,某超大型保险公司核心保单系统完成了改造迁移工作,成功投产上线。 该系统是保险行业中首个采用全栈自主技术的核心业务系统,本次投产实现了从集中式到分布式的架构升级,取得了显著的性能提升,为后续业务增长奠定了基础,同时也为保险业逻辑大集中的核心系统的国产化改造树立了新标杆。

保单系统是保险公司最重要的核心系统,负责管理保险业务的投保、承保、批改等各项功能,为所有内外部承保渠道及其他系统提供服务支撑。在数字经济的发展和新技术崛起的背景下,某超大型保险公司坚持自主创新的系统建设思路 ,运用分布式、微服务、云原生等领先技术对核心保单系统进行了升级改造,使用国产 X86 服务器和 TiDB 分布式数据库替换了原有的小型机和 Oracle 数据库,打造了满足未来业务发展的新一代全栈自主技术平台。

作为核心系统的基础设施,支持大规模数据、高并发、敏捷响应成为数据库的关键能力要求,也是保险业务高质量发展的技术保障。 核心保单系统数据库承载数据量达到 60TB+,规划支持百 TB 级别以上的数据存储,峰值业务吞吐量高于 500 笔每秒,交易峰值响应时间低于 6 毫秒,兼具联机交易和实时分析处理能力,并支持大数据量下的复杂查询。 自 2020 年起,该超大型保险公司与平凯星辰展开深度合作,成功引入 TiDB 分布式数据库用于替代原有的 Oracle 数据库,涵盖了单证系统、天财车险和天财非车险、报价中心、农险理赔等 9 个业务系统。 数据表明,TiDB 的处理性能明显提升,尤其在全量状态统计报表的处理时效上提高了 80 多倍。 通过对 TiDB 分布式数据库的深入研究,开发和运维团队积累了应用适配、数据库迁移、性能优化和运维管理等方面的实践经验,为项目的顺利进行提供了技术保障。

新核心保单系统自上线以来一直保持稳定运行,每天承载保单件数 25 万,涉及金额超 1.5 亿元。在业务高峰时期,TiDB 分布式数据库的性能表现出色,峰值查询每秒达到 64,000 次,平均响应时间仅为 6 毫秒。

此次新核心保单系统的成功投产上线,首次实现了以分布式数据库为代表的全栈自主技术在超大型保险公司核心业务中的应用,在多个方面实现了突破和创新:

1 为逻辑大集中的核心系统改造指明了方向

对于超大型保险公司的保单业务而言,数据量大,负载高,逻辑复杂,经常出现单条 SQL 几千行的情况。核心保单系统属于逻辑大集中的系统,无法进行分库分表,核心表均为宽表、大表且所有业务都与核心表有关联。如果通过表组做分布式,表组之间的访问会造成性能瓶颈;如果使用集中式数据库替换,从小型机到 X86 的迁移必然导致性能下降。此次项目通过对原生分布式数据库的应用,验证了复杂业务逻辑进行分布式改造的可行性,也证实了原生分布式数据库在大数据量复杂逻辑下的 OLTP 性能较分库分表、表组类分布式数据库更具优势。

2 分布式替换集中式保障了大并发下的业务低延时

分布式数据库弹性扩容能力突破了集中式数据库单节点连接数的瓶颈限制,使得中间件到数据库的连接数大幅增加。TiDB 的存储引擎采用 LSM-Tree 数据结构,特别适用于业务高峰期热点表大批量插入的场景,解决了以前 Oracle 写入需等待的问题,同时也有效解决了单一业务高并发场景下,双节点 Oracle RAC 写入性能不足的问题。数据显示,新系统上线后 TiDB 在业务高峰期的平均响应延时比 Oracle 数据库降低了 50% 以上。

3 探索出一套 Oralce 迁移的系统化解决方案

在数据迁移方案层面,项目组对存量大、增量大、单表大的数据进行了对象分组、昼夜分工、大表分片等优化策略,使得全量数据迁移周期压缩了 50% 。在回退方案层面,项目组总结过往实施经验,整理了 18 大类功能测试案例、12 条性能监控点、3 大类数据一致性检查方法和两场全业务模拟验证,保障回退方案的可行性。经过核心业务验证的 Oracle 迁移、并行和回退方案为随后进行的其他业务迁移提供了科学的方法和完备的流程体系。

image.png

数据迁移方案

4 金融级的高可用架构设计

TiDB 分布式数据库提供了金融级的高可用性,通过采用冗余设计确保集群内各个组件的单机故障不会导致系统中断。核心保单系统中的数据采用 5 副本,利用 Multi Raft 协议确保各副本的数据一致性和高可用性。通过 Labels 设置,将五个副本放置到不同的物理机柜上,任意两个副本出现问题都不会对业务造成影响,提升了系统的高可用性和数据容灾能力,为未来多中心的灾备建设奠定了基础。

5 实现整体拥有成本的下降

新系统在硬件、开发和运维等多个层面实现了整体拥有成本的下降。通过采用国产软硬件替换小型机和国外商用软件,采购成本显著降低。尽管在前期分布式架构改造方面会产生一些费用,但从长期来看,无需重复投入。在功能层面,TiDB 提供 HTAP 能力,保单和 ODS (Operational Data Store) 共用一套集群并实现资源隔离,使得业务可以充分利用算力资源,节省了存储成本。开发方面,TiDB 支持自动分片,无需事先设计,对业务开发非常便捷。在运维方面,TiDB 配备可视化运维管理平台,可同时管理上百套集群,大幅节省运维人力成本。

此次投产开创了全栈自主技术在超大型保险公司核心系统中的应用先河,为国内金融行业关键系统的国产化建设提供了有力的实践经验。在 Oracle 数据库迁移和分布式数据库的全栈应用方面积累的经验,将为其他用户提供宝贵的参考借鉴,从而推动整个行业向更高效、更安全可控的技术体系迈进。


PingCAP
1.9k 声望4.9k 粉丝

PingCAP 是国内开源的新型分布式数据库公司,秉承开源是基础软件的未来这一理念,PingCAP 持续扩大社区影响力,致力于前沿技术领域的创新实现。其研发的分布式关系型数据库 TiDB 项目,具备「分布式强一致性事务...