本文基于 YashanDB 架构技术负责人李伟超在“2024国产数据库创新生态大会·根技术专场”的演讲整理。
背景:多模数据时代来了,数据库准备好了吗?
在今天的数字世界里,数据早已不止是表格里的“行与列”。图像、BIM模型、GIS数据、文本、向量……各类异构数据不断涌现。传统关系型数据库面对这些“非结构化挑战”越来越吃力。
YashanDB 正在探索一条路:如何用一套架构,实现对空间、BIM、图、向量等多模态数据的统一存储与融合查询?这既是工程难题,也是AI+时代数据库的突围路径。
现实挑战有哪些?
1)智慧城市建设的痛点
空间数据来源杂、模型不一,标准混乱
数据存储分散、处理效率低,烟囱式架构难以支撑实时性需求
CIM/BIM 平台对数据库性能要求极高
多时态、多粒度空间+建模数据融合难度大
2)AI大模型的数据瓶颈
超高维向量存储(上亿条,动辄PB级)
模型知识更新滞后,不能实时反应新数据
多模态数据融合不足,难支撑具身智能、世界模型等新范式
技术路线:从底层架构破局
存算分离架构
分离计算与存储资源,实现按需扩展
支持冷数据下沉至低成本对象存储
采用 PN 组调度机制,提供本地缓存加速,兼顾分离与性能
YashanDB V23.3 版本已全面支持,架构升级不再只是纸上谈兵。
联邦查询:跨库异构访问一步到位
支持跨 Hive、Iceberg、Hudi、Oracle 等多种数据库与数据湖
兼容 HDFS、S3、OSS 存储协议
接入异构文件格式(CSV/Parquet/ORC)
可加速外部数据查询,支持 HTAP 混合负载
多模数据管理实践:不仅存得下,还能查得快
空间数据(GIS)
已推出 YashanDB for GIS 模块,支持空间原语、空间平台双能力,并服务于多个客户场景(智慧城市、金融网点选址等)。
BIM 数据
一套系统直接解析与管理复杂 BIM 数据格式,统一关系型、半结构化、文件型存储,不再依赖多个数据库拼凑。
图数据
支持图建模
支持 SQL 扩展语法(PGQL)
初步实现图数据与关系数据的联合查询
向量数据(AI)
支持向量数据的存储与检索
使用索引加速相似性查询
探索向量+属性混合检索逻辑,提升准确性同时降低计算复杂度
战略目标:打造“全模融合”数据平台
YashanDB 的多模管理目标非常明确:
一套存储引擎托管多类型数据
一套 SQL 实现跨模态查询
一套资源调度策略适配不同负载
一个平台对接多数据源联邦分析
结语:多模数据不是未来,是现在
在智慧城市、金融科技、AI模型、工业制造等领域,多模态数据已不是“未来趋势”,而是当下刚需。
YashanDB 所推进的融合式数据库路径,不仅是一种技术选择,更是回应“数据资产价值最大化”的产业趋势。
多模数据融合不是“支持某个数据类型”,而是从架构层面“重新思考数据的管理方式”。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。