Zilliz 又双叒叕有好消息传来!
自 NVIDIA GTC Keynote 被黄老板点名后,Zilliz 又加入“大网红 OpenAI ”的朋友圈——作为首批受邀合作伙伴,向 ChatGPT 贡献了向量数据库插件,打通了知识召回与大型语言模型之间的桥梁!
ChatGPT 联网,向量数据库已加入“团战”
今晨,Open AI 再次向科技行业扔出重磅武器 ——部分解除 ChatGPT 无法联网的限制。OpenAI 通过接入第三方插件让 ChatGPT 得以联网,达到“眼观六路耳听八方”的效果,这意味着,ChatGPT 自此可以真正做到检索实时信息、检索知识库信息、代表用户执行操作。
在此情况下,如何使 ChatGPT 从数据源中获取最为精准的信息便显得尤为关键,这其中向量数据库的重要性不言而喻。OpenAI 在公告中明确表示:开源检索插件使得 ChatGPT 经许可后访问个人或组织的信息源。它允许用户通过提问或用自然语言的方式表达需求,并从他们的数据源中获取最相关的文档片段,例如文件、笔记、电子邮件或公共文档。
而为了更好地为开发者提供相应支持,OpenAI 提供了 6 个可以实现有效检索的向量数据库,而 Milvus 和 Zilliz 同时入选,能够帮开发者或用户索引和搜索文档。Milvus 是全球首家以“向量数据库”命名的非结构化数据项目,由商业公司 Zilliz 进行运营支持,是行业公认的“世界上最快的向量数据库”。
大模型时代,我们为何如此重要?
大模型浪潮汹涌而至,向量数据库注定要掀起一波检索巨浪。如果说 ChatGPT 是 LLM 的处理核心,prompts 是 code,那么向量数据库就是 LLM 需要的存储。
目前,Milvus 已得到全球上千家企业级用户的信赖,包括 NVIDIA、eBay、Shopee、Walmart、快手、宜家等,最大部署规模超过 10 亿向量。同时,在很多应用场景下,Milvus 的 QPS 超过 10K。
Milvus 典型的应用领域包括长文本、图片、视频等,在长文本领域,可以进行翻译、问答、语义检索、情感分析,语义检索和问答可以与 ChatGPT 配合使用,提升其回答的准确度;在图片领域可以进行去重、目标检测、图片检索、多模态的图文互搜;在视频领域进行推荐、合规检测、分类等。
当然,也有很多新兴的应用场景,包括在生物制药领域把生物分子式转化成向量,判断生物小分子与蛋白质能否紧密结合;在音频领域进行去重、情感分析;在风控领域识别潜在的风险;在自动驾驶领域可以通过向量检索帮助自动驾驶找出实时判断过程中没有分析出来的物体。
Zilliz 拥有双重身份,它不仅仅是 Milvus 背后的商业公司,也拥有 Zilliz Cloud 这样的云原生向量数据库服务产品,在 Milvus 的基础上,有效帮助用户解决在运维、部署、性能等方面的问题,真正做到“忘记复杂,关注业务和数据本身”。
参考资料
Milvus:https://milvus.io/
Zilliz:https://zilliz.com/
检索插件存储库:https://github.com/openai/chatgpt-retrieval-plugin
OpenAI :https://openai.com/blog/chatgpt-plugins
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。