MariaDB 11.6 发布向量搜索功能预览
MariaDB 基金会宣布在开源 MySQL 分支 MariaDB 11.6 中推出向量搜索(Vector search)的公共预览。这一功能被视为 MariaDB 在 MySQL 生态系统中领先的机会,特别是因为 Oracle 将其大部分新功能保留给企业版。
主要观点和关键信息
发布时间与计划
- MariaDB 11.6 的完整版向量搜索(Vector Edition)预计将在未来几个月内发布。
- 向量功能将在 MariaDB 11.7 及更高版本中全面提供。
功能实现
- MariaDB 尚未提供专门的向量数据类型,但引入了专用索引和函数
VEC_ToText和VEC_FromText,用于存储向量。 - 向量搜索基于行业标准的 HNSW 算法。
- 新的 MariaDB Vector 存储引擎(已在 FOSDEM 上展示)将成为标准 MariaDB 服务器的一部分。
- MariaDB 尚未提供专门的向量数据类型,但引入了专用索引和函数
与 MySQL 的对比
- MySQL 9.0 提供了新的向量类型,但没有索引支持。
- MariaDB 的向量搜索功能是开源的,而 MySQL 的向量功能(Heatwave)则主要在企业版中提供。
开源社区的反馈
- Kaj Arnö(MariaDB 基金会 CEO)表示,MariaDB 的目标是为 MySQL 和 MariaDB 用户提供开源的向量功能,并强调从 MySQL 迁移到 MariaDB 非常容易。
- Peter Zaitsev(Percona 创始人)认为,MariaDB 在向量搜索方面的进展表明其在现代开发者关注的功能上领先于 Oracle MySQL。
合作与支持
- 向量搜索功能的实现由 MariaDB plc、MariaDB 基金会及其他贡献者(特别是 AWS)共同完成。
- AWS 是 MariaDB 的最新钻石级赞助商之一。
行业趋势
- 随着生成式 AI 工作负载的普及,MariaDB 并非唯一支持向量搜索的关系型数据库。
- Google 和 AWS 也在其托管关系型数据库(RDBMS)中引入了向量搜索功能。
- PlanetScale 去年宣布计划分叉 MySQL 以添加向量搜索功能。
用户反馈
- 一些开发者认为,除非处理数十亿级别的数据,否则不需要多种向量数据库选择。
性能与可用性
- Sergei Golubchik(MariaDB plc 首席架构师)在文章《How Fast Is MariaDB Vector?》中,使用 ann-benchmarks 套件将 MariaDB 向量搜索与其他向量数据库进行了性能对比。
- 目前,MariaDB 11.6 是 alpha 版本,尚未提供完整的二进制包,但已提供支持向量搜索的容器镜像(CPU 优化版)。
总结
MariaDB 11.6 的向量搜索功能是其开源战略的重要一步,旨在为开发者提供现代 AI 工作负载所需的工具。通过与 MySQL 的对比和社区反馈,MariaDB 在向量搜索领域的进展显示其在与 Oracle MySQL 竞争中的优势。未来,随着功能的进一步完善,MariaDB 有望在关系型数据库市场中占据更重要的地位。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用@来通知其他用户。