导读
2025 年,AI 技术呈爆发式发展,数智化转型成为企业构建竞争优势、实现可持续发展的核心驱动力。在这一关键进程中,数据库与技术栈的选型,作为企业数字化基础设施建设的关键环节,深刻影响着企业整体效能的提升和业务的拓展。本文将围绕企业数智化转型目标,深入剖析转型的四大阶段,并详细阐述 TiDB 在各阶段的独特应用优势,为企业数智化转型提供有益参考。
本文作者:TiDB 高级售前顾问 李振环
企业数智化转型的目标
- 确保供应链安全 : 国产化的大背景下,企业所采用的数据库应具备自主能力,满足开源策略,以保障业务的持续稳定运营
- 运营降本 提效 : 基于合理的数据库选型构建数据底座,有效减少技术运营开销,助力企业加速技术转型。借助优化后的数据库架构,加速线下业务实现线上化、流程化与自动化,提升业务处理效率。以供应链管理为例,通过搭建构建供应链可视化及智能调度系统,完善线上线下流程的打通与智能化,进而提升整体运营水平
- 支撑业务增长 : 数智化转型中的技术应能迅速为业务增长赋能。当企业业务实现线上转型且用户数量显著增长时,需选用具备可扩展性的数据库。同时,注重提升客户体验和满意度,增强企业的市场竞争力
- 数据驱动 组织发展 : 企业可收集大量用户行为数据和交易数据,通过深入分析这些数据,驱动企业决策和转型。比如,依据市场动态数据分析结果,调整生产线产品的产出,实现企业资源的优化配置
- 提升智能化 :在当前 AI 技术迅速发展的大环境下,企业需将数据结合人工智能应用,借助企业知识库和智能客服等方式为企业赋能,实现更高效的数智化转型,提升市场竞争力
数智化转型四个阶段
数智化的广度与深度是衡量企业数智化水平的两大重要维度。随着数智化深度及广度不断深入和扩展,企业数智化转型将呈现出阶段性发展。
第一阶段 : 重点是基于数据库选型打造数智化底座。此时,仅有部分业务系统开启数智化转型进程,尚处于单点转型状态,整体信息化程度不高。
第二阶段 : 众多业务系统在数智化底座的基础上进行线上化改造。此阶段需要汇聚各业务系统的数据,开展实时链路决策,并基于这些业务数据进行实时数据分析,以满足业务迭代需求,提升运营效率。同时,数据分析的可视化能力也会得到提升。
第三阶段 : 在业务系统完成线上化且积累了数据分析成果的基础上,将业务与线下流程打通,实现应用与流程的线上化、数智化、一体化运营。如此一来,便完成了整个业务层面或部门层面的数智化改造。
第四阶段 : 企业全面数智化阶段,在这一阶段引入 AI 大模型的能力,实现 AI 赋能。
第一阶段:数据库底座
企业理想的数据库底座应具备四项关键能力:
- 充分利用硬件资源、资源观测性 : 这不仅可以有效降低企业的硬件成本,而且在出现故障时,能够迅速响应并排查问题
- 通用性强 : 作为数据库底座,它需要支持几乎所有的业务系统,涵盖 TP、AP 以及 AI 等多种场景。采用单一技术栈支撑多场景,有助于降低技术栈复杂度,减少开发和运维人员的学习成本
- 高可靠性 : 数据库底座承担着支撑众多业务系统的重任,其可靠性直接关系到业务的连续性和稳定性。因此,在选择数据库时,高可靠性至关重要。理想的数据库需具备单点故障自恢复能力和稳定的内核。此外,在实施多库合一以节约资源时,要避免不同业务系统之间的资源干扰,确保各业务系统在共享资源的同时,能够独立、高效的运行
- 简单易用、易运维 :数智化转型时,需面对用户的多样化需求,需要一个快速迭代的数据库,对应用透明,无需进行分库分表操作,否则会大幅增加研发工作的复杂度和工作量,拖垮研发效率,降低企业的竞争优势
应用 TiDB 建设数据库底座的优势 :
- 自主开源 , 安全可控 : 数据库选型是一个持续且关键的决策,因此满足安全可控要求极其重要。
- 通用性强 : 可以基于 Resource Control 多库合一的方案,实现小业务的合并以及大业务的独立集群的部署,实现 TP、AP 的一体化,同时具备 AI 能力来赋能业务。
- 一体化高扩展性、高可用 : TiDB 在扩展性、高可用方面具有独特优势。对比之下,单机数据库在以往使用场景中常常暴露诸多问题。其一,单机数据库扩展性有限,在需要扩展时,往往要考虑分库分表,这无疑增加了业务的复杂程度;其二,当企业使用多个 MySQL 数据库时,数据孤岛现象严重,各数据库间的数据难以互联互通,无法实现有效的数据共享;其三,单机 MySQL 的高可用能力存在短板,容易影响业务的连续性。
第二阶段:实时决策平台建设
数智化转型的第二个阶段,是构建一个实时数据决策平台。以往传统企业在进行数据实时决策时,通常依赖三个技术栈。首先会使用标准的 OLTP 数据库,通过 ETL 数据同步,将 OLTP 数据库中的数据抽取到 Hadoop 或者 Spark 数仓之中。在数仓对数据完成加工后,将生成的 APP 层或报表层数据输出到另一技术栈,例如 Clickhouse,以完成报表查询或数据服务。然而,这样的链路存在一些问题:其一,涉及的技术栈众多,运维难度大,学习成本高。其二,同步链路冗长,维护困难。例如,若上游发生 DDL 变更,下游可能无法支持,就需要手动干预。
而传统企业可以依托 TiDB 来构建新一代实时决策平台。TiDB 的核心优势在于能够一站式实现三个技术场景:
- 海量数据汇聚,TiDB 高度兼容 MySQL 协议,并且提供了 DM 数据实时同步工具,可完成海量数据的实时汇聚;
- 实时数据增量加工,基于 TiDB 以及 TiFlash 可以实现实时数据的增量加工;
- 高并发数据服务,凭借 TiDB 天然的 HTAP 能力,能够满足高并发数据服务的需求。
如架构图所示,我们可将这些业务系统的数据实时同步到 TiDB 的汇聚库。此时,TiDB 实际上成为了所有业务系统的实时备库。基于这个全局实时备库,可以开展诸多操作:
- 首先是业务的读写分离。若业务需要进行实时数据分析,以往在主库查询可能速度较慢,且对主库业务产生侵入性影响,此时可迁移至 TiDB 进行查询。
- 其次,对于归档的历史数据,可通过 DM filter 的方式将数据归档到数仓一侧,不再进行额外处理。在数仓完成数据归档后,历史数据也能直接在这个实时备库中进行查询。
- 实时备库还可用于业务跑批。若之前主库跑批效率较低,可在实时备库中进行跑批操作,跑批完成后甚至可回写到业务主库,通过这种读写分离的方式有效降低业务主库的压力。
- 在统一视图方面,以实时风控为例,其需要众多业务系统提供 API 服务。有了全局实时备库后,可统一从 TiDB 提供数据 API 服务,为实时风控提供支持,从而减少实时风控对业务主库查询的压力。同时,也避免了因业务主库开发 API 排期较长,而拖慢实时风控迭代效率的问题。
基于该架构,还可开展一些活动,如积分电子券赠送等,提升数字化营销能力。在这一架构下,TiDB 能够一站式满足三种能力需求:一是多源实时汇聚,支持海量数据,可通过 DM 以及 Kafka 等策略实现数据汇聚;二是实时数据加工,借助 TiDB 的 HTAP 能力完成实时数据加工;三是一站式提供高并发数据服务,例如满足实时风控以及业务系统读写分离的需求,更高效地赋能业务系统,降低业务系统读写分离时对主库造成的压力。
第三阶段:DTC (Direct to Customer)线上线下一体化
DTC 模式目前面临着一些挑战。其中,数据互联互通问题尤为突出,存在大量数据孤岛,难以提供统一的数据服务。部分企业仅有线下数据,这些数据存储于工作站或者员工个人手机等设备中,尚未实现数据线上化。
其次,在完成数据线上化后,企业需要依据这些数据制定实时运营策略,以指导业务发展。但随着业务规模的急剧扩张,数据量大幅增长,此时要求一个数据库具备高效处理数据增长的能力。并且,线下线上一体化所涉及的往往是公司的核心业务,必须确保业务的连续性,从而为客户持续提供高可靠的服务。
在 DTC 场景下,数据库也面临着诸多关键挑战。首先是对弹性扩展能力的需求即为迫切。随着业务发展产生海量数据,需要能够通过单个集群实现在线扩充,从而满足业务需求。其次,由于业务场景关乎核心,需持续为客户提供服务,所以数据库必须具备高可靠能力。此外,还要为 DTC 提供数智化运营的实时分析能力,这就要求具备海量数据汇聚能力,并能快速完成实时数据洞察,以此指导业务发展方向。最后,在数据库选型方面,由于核心业务涉及海量用户需求,需要一个无侵入性的数据库,以契合业务高速迭代发展的节奏,保障业务迭代开发的效率。
DTC 线上线下一体化:为什么 TiDB 是更好的选择?
在 DTC 场景中,TiDB 之所以是更优选择,原因如下:其一,TiDB 能够无侵入性地满足业务开发迭代需求。其二,相较于分库分表,TiDB 的数据分析能力和扩展性更为出色。它在复杂 SQL 关联查询分析能力上表现卓越,并且 TiFlash 的加速效果显著。相比之下,之前的单机数据库或分库分表方式,均无法满足 DTC 场景下数智化运营以及业务高速增长的需求 。
第四阶段:业务 AI 一体化
随着 DeepSeek 等技术的出现,AI 技术发展火热。企业在构建 AI 能力时,以往通常需要关系型数据库、向量数据库、图数据库、宽表数据库各四个技术栈。然而,这样的技术架构会导致整体建设成本较高,技术栈复杂,对人力的要求也颇为严格。
而使用 TiDB 则能够一站式支撑上述四个方面的需求,实现 “All in One”。TiDB 不仅支持关系型数据库功能,还具备图数据库、向量数据库以及宽表数据库的能力。如此一来,能够有效降低架构的技术复杂度,提升开发效率,同时降低业务成本。
整体而言,使用 TiDB 带来的最大收益在于降低综合成本。以往需要多个技术栈协同工作,现在仅依靠 TiDB 就能满足多种需求。
自 TiDB V8.5 起,新增对向量数据类型的全面支持。用户基于 SQL 能便捷创建向量类型并建立索引,高效查询相似数据。TiDB 还支持构建知识图谱、借助 HNSW 算法实现向量索引的高效检索,满足 AI 场景对查询效率的要求,为智能应用开发提供强大助力。
应用 TiDB 进行数智化转型的收益总结
- 自主开源, 安全可靠: TiDB 为开源数据库产品,并且满足国产化要求,能够为企业数智化转型提供坚实的安全保障。
- 优化运营效率,降低成本 : 一方面,TiDB 作为数智化底座,可有效降低 TCO ;另一方面,通过 Resource Control 的方式,提升硬件资源利用率,从而减少企业成本支出。TiDB 能够满足业务快速迭代的需求,其应用无侵入性的特点,让企业实现更加高效、便捷地开发。
- 支持 业务增长 : TiDB 具备高吞吐能力和良好的可扩展性,能够快速适应业务
增长,有力支撑企业业务的不断发展。
- 数据驱动业务发展 : 作为 HTAP 数据库,TiDB 在数据驱动业务发展方面表现出色,能够很好地实现 TP 和 AP 的一体化,提供实时洞察,为企业决策提供有力的数据支持。
- 提升 企业 智能化 水平 : TiDB 与 AI 能力相结合,能够助力 AI 智能化的数据落地,满足企业在智能化发展方面的需求。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。