本文基于 YashanDB 架构技术负责人李伟超在“2024国产数据库创新生态大会·根技术专场”的演讲整理。

背景:多模数据时代来了,数据库准备好了吗?

在今天的数字世界里,数据早已不止是表格里的“行与列”。图像、BIM模型、GIS数据、文本、向量……各类异构数据不断涌现。传统关系型数据库面对这些“非结构化挑战”越来越吃力。

YashanDB 正在探索一条路:如何用一套架构,实现对空间、BIM、图、向量等多模态数据的统一存储与融合查询?这既是工程难题,也是AI+时代数据库的突围路径。
image.png

现实挑战有哪些?

1)智慧城市建设的痛点

空间数据来源杂、模型不一,标准混乱

数据存储分散、处理效率低,烟囱式架构难以支撑实时性需求

CIM/BIM 平台对数据库性能要求极高

多时态、多粒度空间+建模数据融合难度大

2)AI大模型的数据瓶颈

超高维向量存储(上亿条,动辄PB级)

模型知识更新滞后,不能实时反应新数据

多模态数据融合不足,难支撑具身智能、世界模型等新范式

技术路线:从底层架构破局
image.png
存算分离架构
分离计算与存储资源,实现按需扩展
支持冷数据下沉至低成本对象存储
采用 PN 组调度机制,提供本地缓存加速,兼顾分离与性能
YashanDB V23.3 版本已全面支持,架构升级不再只是纸上谈兵。
image.png
联邦查询:跨库异构访问一步到位
支持跨 Hive、Iceberg、Hudi、Oracle 等多种数据库与数据湖

兼容 HDFS、S3、OSS 存储协议

接入异构文件格式(CSV/Parquet/ORC)

可加速外部数据查询,支持 HTAP 混合负载

image.png
多模数据管理实践:不仅存得下,还能查得快
image.png

空间数据(GIS)

已推出 YashanDB for GIS 模块,支持空间原语、空间平台双能力,并服务于多个客户场景(智慧城市、金融网点选址等)。

BIM 数据

一套系统直接解析与管理复杂 BIM 数据格式,统一关系型、半结构化、文件型存储,不再依赖多个数据库拼凑。

图数据

支持图建模

支持 SQL 扩展语法(PGQL)

初步实现图数据与关系数据的联合查询

向量数据(AI)

支持向量数据的存储与检索

使用索引加速相似性查询

探索向量+属性混合检索逻辑,提升准确性同时降低计算复杂度
image.png

战略目标:打造“全模融合”数据平台

YashanDB 的多模管理目标非常明确:

一套存储引擎托管多类型数据

一套 SQL 实现跨模态查询

一套资源调度策略适配不同负载

一个平台对接多数据源联邦分析

结语:多模数据不是未来,是现在

在智慧城市、金融科技、AI模型、工业制造等领域,多模态数据已不是“未来趋势”,而是当下刚需。

YashanDB 所推进的融合式数据库路径,不仅是一种技术选择,更是回应“数据资产价值最大化”的产业趋势。

多模数据融合不是“支持某个数据类型”,而是从架构层面“重新思考数据的管理方式”。


数据库砖家
1 声望0 粉丝