MariaDB引入开源向量预览,旨在成为默认MySQL选项

MariaDB 11.6 发布向量搜索功能预览

MariaDB 基金会宣布在开源 MySQL 分支 MariaDB 11.6 中推出向量搜索(Vector search)的公共预览。这一功能被视为 MariaDB 在 MySQL 生态系统中领先的机会,特别是因为 Oracle 将其大部分新功能保留给企业版。

主要观点和关键信息

  1. 发布时间与计划

    • MariaDB 11.6 的完整版向量搜索(Vector Edition)预计将在未来几个月内发布。
    • 向量功能将在 MariaDB 11.7 及更高版本中全面提供。
  2. 功能实现

    • MariaDB 尚未提供专门的向量数据类型,但引入了专用索引和函数 VEC_ToTextVEC_FromText,用于存储向量。
    • 向量搜索基于行业标准的 HNSW 算法
    • 新的 MariaDB Vector 存储引擎(已在 FOSDEM 上展示)将成为标准 MariaDB 服务器的一部分。
  3. 与 MySQL 的对比

    • MySQL 9.0 提供了新的向量类型,但没有索引支持。
    • MariaDB 的向量搜索功能是开源的,而 MySQL 的向量功能(Heatwave)则主要在企业版中提供。
  4. 开源社区的反馈

    • Kaj Arnö(MariaDB 基金会 CEO)表示,MariaDB 的目标是为 MySQL 和 MariaDB 用户提供开源的向量功能,并强调从 MySQL 迁移到 MariaDB 非常容易。
    • Peter Zaitsev(Percona 创始人)认为,MariaDB 在向量搜索方面的进展表明其在现代开发者关注的功能上领先于 Oracle MySQL。
  5. 合作与支持

    • 向量搜索功能的实现由 MariaDB plc、MariaDB 基金会及其他贡献者(特别是 AWS)共同完成。
    • AWS 是 MariaDB 的最新钻石级赞助商之一。
  6. 行业趋势

    • 随着生成式 AI 工作负载的普及,MariaDB 并非唯一支持向量搜索的关系型数据库。
    • Google 和 AWS 也在其托管关系型数据库(RDBMS)中引入了向量搜索功能。
    • PlanetScale 去年宣布计划分叉 MySQL 以添加向量搜索功能。
  7. 用户反馈

    • 一些开发者认为,除非处理数十亿级别的数据,否则不需要多种向量数据库选择。
  8. 性能与可用性

    • Sergei Golubchik(MariaDB plc 首席架构师)在文章《How Fast Is MariaDB Vector?》中,使用 ann-benchmarks 套件将 MariaDB 向量搜索与其他向量数据库进行了性能对比。
    • 目前,MariaDB 11.6 是 alpha 版本,尚未提供完整的二进制包,但已提供支持向量搜索的容器镜像(CPU 优化版)。

总结

MariaDB 11.6 的向量搜索功能是其开源战略的重要一步,旨在为开发者提供现代 AI 工作负载所需的工具。通过与 MySQL 的对比和社区反馈,MariaDB 在向量搜索领域的进展显示其在与 Oracle MySQL 竞争中的优势。未来,随着功能的进一步完善,MariaDB 有望在关系型数据库市场中占据更重要的地位。

阅读 19
0 条评论