AI 未来已至,向量数据库站在新的节点上

“AI 的 iPhone 时刻已经到来。”

在刚刚结束的 NVIDIA GTC Keynote 中,这句话被 NVIDIA CEO 黄仁勋反复提及,长达 1 个多小时的分享中,生成式 AI 相关的内容占据了绝大部分比重。他表示,生成式 AI 的火热能力为企业带来了挑战,因而此次 Keynote 的重点主要是讨论“加速计算和 AI 如何成为强大的工具,帮人们应对这些挑战和把握未来的巨大机遇。”

在加速库部分,黄仁勋首次提及向量数据库(Vector Database),并强调对于构建专有大型语言模型的组织而言,向量数据库至关重要。

1.向量数据库为何如此重要?

NVIDIA GTC(英伟达 GPU 技术大会)是 AI 与元宇宙时代的开发者大会,参会者通常是学生、开发者、研究人员、创作者、IT 决策者、企业领袖等,主要探讨如何利用 AI、加速计算、数据科学等技术力量塑造当今世界。此次 GTC Keynote,生成式 AI 毫无悬念地成为焦点。

在介绍加速库部分,黄仁勋提到,推荐系统普遍使用向量数据库来存储、索引、搜索和检索非结构化数据的大型数据集。向量数据库的一个新型重要用例是大型语言模型,在文本生成过程中可用于检索领域特定事实或专有事实。

“我们将推出一个新的库,即 RAFT,用于加速索引、数据加载和近邻检索。我们正在将 RAFT 的加速引入到 Meta 的开源 FAISS AI 相似性搜索,超过 1000 家组织使用的 Milvus 开源向量数据库以及 Docker 镜像下载次数超过 40 亿次的 Redis。对于构建专有大型语言模型的组织而言,向量数据库至关重要。”黄仁勋表示。

2.Milvus:世界上最快的向量数据库

黄仁勋在 Keynote 中提到的 Milvus 是全球首家以“向量数据库”命名的非结构化数据项目,由商业公司 Zilliz 进行运营支持。截至目前,Milvus 已得到全球上千家企业级用户的信赖,包括 NVIDIA、eBay、Shopee、Walmart、快手、宜家等,最大部署规模超过 10 亿向量。同时,在很多应用场景下,Milvus 的 QPS 超过 10K。

Milvus 典型的应用场景包括:在长文本领域,可以进行翻译、问答、语义检索、情感分析,语义检索和问答可以与 ChatGPT 配合使用,提升其回答的准确度;在图片领域可以进行去重、目标检测、图片检索、多模态的图文互搜;在视频领域进行推荐、合规检测、分类等。

当然,也有很多新兴的应用场景,包括在生物制药领域把生物分子式转化成向量,判断生物小分子与蛋白质能否紧密结合;在音频领域进行去重、情感分析;在风控领域识别潜在的风险;在自动驾驶领域可以通过向量检索帮助自动驾驶找出实时判断过程中没有分析出来的物体。

值得一提的是,Milvus 近日上线了支持 GPU 的 2.3 Beta 版本,灵活性和性能得到显著提升。不止如此,Milvus 2.3 Beta 版本还增加了 upsert、rangesearch、mmap 等社区用户呼声较高的功能,将为用户带来全新的升级体验!

AI 的 iPhone 时刻已经到来,作为 AI 基础设施的向量数据库 Milvus 亦站在了新的节点上。

本文由mdnice多平台发布

Vector database for Enterprise-grade AI

127 声望
808 粉丝
0 条评论
推荐阅读
头部大模型公司进京赶考,向量数据库成为应考神器
日前,由品玩主办的「模型思辨」国内大模型产业生态研讨会在北京举办,Zilliz 与 360 集团、阿里巴巴、昆仑万维等来自大模型产业链的头部公司及投资机构参会,会上 Zilliz 创始人兼首席执行官星爵、360 集团创始...

Zilliz阅读 179

花了几个月时间把 MySQL 重新巩固了一遍,梳理了一篇几万字 “超硬核” 的保姆式学习教程!(持续更新中~)
MySQL 是最流行的关系型数据库管理系统,在 WEB 应用方面 MySQL 是最好的 RDBMS(Relational Database Management System:关系数据库管理系统)应用软件之一。

民工哥14阅读 2.1k

封面图
硬卷完了!MongoDB 打怪升级进阶成神之路( 2023 最新版 )!
前面我们学习:MySQL 打怪升级进阶成神之路、Redis 打怪升级进阶成神之路,然后我们还在继续 NoSQL 的卷王之路。从第一篇文章开始,我们逐步详细介绍了 MogoDB 基础概念、安装和最基本的CURD操作、索引和聚合、工...

民工哥7阅读 800

封面图
初学后端,如何做好表结构设计?
这篇文章介绍了设计数据库表结构应该考虑的4个方面,还有优雅设计的6个原则,举了一个例子分享了我的设计思路,为了提高性能我们也要从多方面考虑缓存问题。

王中阳Go4阅读 1.8k评论 2

封面图
MySQL百万数据深度分页优化思路分析
一般在项目开发中会有很多的统计数据需要进行上报分析,一般在分析过后会在后台展示出来给运营和产品进行分页查看,最常见的一种就是根据日期进行筛选。这种统计数据随着时间的推移数据量会慢慢的变大,达到百万...

一个程序员的成长7阅读 999

封面图
深入理解MySQL索引底层数据结构
在日常工作中,我们会遇见一些慢SQL,在分析这些慢SQL时,我们通常会看下SQL的执行计划,验证SQL执行过程中有没有走索引。通常我们会调整一些查询条件,增加必要的索引,SQL执行效率就会提升几个数量级。我们有没...

京东云开发者3阅读 622

封面图
一文了解MySQL中的多版本并发控制
作者:京东零售  李泽阳最近在阅读《认知觉醒》这本书,里面有句话非常打动我:通过自己的语言,用最简单的话把一件事情讲清楚,最好让外行人也能听懂。也许这就是大道至简,只是我们习惯了烦琐和复杂。希望借助...

京东云开发者2阅读 542

封面图

Vector database for Enterprise-grade AI

127 声望
808 粉丝
宣传栏