“AI 的 iPhone 时刻已经到来。”
在刚刚结束的 NVIDIA GTC Keynote 中,这句话被 NVIDIA CEO 黄仁勋反复提及,长达 1 个多小时的分享中,生成式 AI 相关的内容占据了绝大部分比重。他表示,生成式 AI 的火热能力为企业带来了挑战,因而此次 Keynote 的重点主要是讨论“加速计算和 AI 如何成为强大的工具,帮人们应对这些挑战和把握未来的巨大机遇。”
在加速库部分,黄仁勋首次提及向量数据库(Vector Database),并强调对于构建专有大型语言模型的组织而言,向量数据库至关重要。
1.向量数据库为何如此重要?
NVIDIA GTC(英伟达 GPU 技术大会)是 AI 与元宇宙时代的开发者大会,参会者通常是学生、开发者、研究人员、创作者、IT 决策者、企业领袖等,主要探讨如何利用 AI、加速计算、数据科学等技术力量塑造当今世界。此次 GTC Keynote,生成式 AI 毫无悬念地成为焦点。
在介绍加速库部分,黄仁勋提到,推荐系统普遍使用向量数据库来存储、索引、搜索和检索非结构化数据的大型数据集。向量数据库的一个新型重要用例是大型语言模型,在文本生成过程中可用于检索领域特定事实或专有事实。
“我们将推出一个新的库,即 RAFT,用于加速索引、数据加载和近邻检索。我们正在将 RAFT 的加速引入到 Meta 的开源 FAISS AI 相似性搜索,超过 1000 家组织使用的 Milvus 开源向量数据库以及 Docker 镜像下载次数超过 40 亿次的 Redis。对于构建专有大型语言模型的组织而言,向量数据库至关重要。”黄仁勋表示。
2.Milvus:世界上最快的向量数据库
黄仁勋在 Keynote 中提到的 Milvus 是全球首家以“向量数据库”命名的非结构化数据项目,由商业公司 Zilliz 进行运营支持。截至目前,Milvus 已得到全球上千家企业级用户的信赖,包括 NVIDIA、eBay、Shopee、Walmart、快手、宜家等,最大部署规模超过 10 亿向量。同时,在很多应用场景下,Milvus 的 QPS 超过 10K。
Milvus 典型的应用场景包括:在长文本领域,可以进行翻译、问答、语义检索、情感分析,语义检索和问答可以与 ChatGPT 配合使用,提升其回答的准确度;在图片领域可以进行去重、目标检测、图片检索、多模态的图文互搜;在视频领域进行推荐、合规检测、分类等。
当然,也有很多新兴的应用场景,包括在生物制药领域把生物分子式转化成向量,判断生物小分子与蛋白质能否紧密结合;在音频领域进行去重、情感分析;在风控领域识别潜在的风险;在自动驾驶领域可以通过向量检索帮助自动驾驶找出实时判断过程中没有分析出来的物体。
值得一提的是,Milvus 近日上线了支持 GPU 的 2.3 Beta 版本,灵活性和性能得到显著提升。不止如此,Milvus 2.3 Beta 版本还增加了 upsert、rangesearch、mmap 等社区用户呼声较高的功能,将为用户带来全新的升级体验!
AI 的 iPhone 时刻已经到来,作为 AI 基础设施的向量数据库 Milvus 亦站在了新的节点上。
本文由mdnice多平台发布
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。