Milvus 在 Likee 短视频去重业务中的实践

2022-06-20
阅读 2 分钟
1.3k
本篇内容主要介绍拥有全球 4 亿用户的视频直播公司 BIGO 如何利用向量搜索引擎 Milvus 进行海量短视频去重的工作。在 Milvus 向量搜索引擎的加速下,BIGO 旗下的短视频产品 Likee 能够将每次搜索都控制在 200ms 内,并且能够保证较高的召回率。同时,我们采用了横向扩展 Milvus 的方式来提高向量查询的吞吐量,来保证业...
封面图

图像审核产品“侦图” —— Milvus 在翼支付风控场景中的应用

2022-06-10
阅读 4 分钟
1.6k
本文从翼支付风控的实际应用场景出发,介绍了图像审核产品“侦图”如何检测虚假营业执照,店内门头照、相似模板照的识别问题,“侦图”产品通过引入 Milvus 来进行特征向量检索,在检索速度上,千万级别向量查询时,单条向量查询时间不高于 1 秒,批量查询的单条平均时间不高于 0.08 秒,极大节省了开发成本,并显著提高了系...
封面图

Milvus 2.0 数据插入与持久化

2022-03-24
阅读 8 分钟
2.9k
编者按:本文详细介绍了Milvus2.0数据插入流程以及持久化方案Milvus 2.0 整体架构介绍数据写入相关的组件介绍ProxyData coordData nodeRoot coord & Time tickData allocation 数据分配数据组织结构文件结构及数据持久化Milvus 2.0 整体架构介绍上图是 Milvus 2.0 的一个整体架构图,从最左边 SDK 作为入口,通过 Load B...

开箱即用的 Embedding 流水线

2022-02-28
阅读 3 分钟
2.3k
“万物皆可 Embedding”这句话似乎每个做算法模型小伙伴都听过了。“万物”具体是指什么呢?Embedding 又是如何实现的呢?本文介绍了一款像积木般易于组合、开箱即用的 Embedding 流水线。本文转载自知乎用户 CSY,转载已获得原作者授权。原文请见:[链接]

声纹识别帮你守住钱袋子,聊一聊证券行业里的人工智能

2021-10-26
阅读 4 分钟
1.6k
股票、证券等金融交易越来越多地脱离线下而转向线上进行,指纹、人脸等生物识别技术普及,而与「钱」相关的场景,如何精确地完成身份识别和认证?如何保证业务合规?具体而言:
封面图

13 种高维向量检索算法全解析!数据库顶会 VLDB 2021 论文作者干货分享

2021-09-29
阅读 7 分钟
3.5k
编者按: 以图搜图、商品推荐、社交推荐等社会场景中潜藏了大量非结构化数据,这些数据被工程师们表达为具有隐式语义的高维向量。为了更好应对高维向量检索这一关键问题,杭州电子科技大学计算机专业硕士王梦召等人探索并实现了「效率和精度最优权衡的近邻图索引」,并在数据库顶会 VLDB 2021 上发表成果。作为连接生产...
封面图

千万量级图片视频快速检索,轻松配置设计师的灵感挖掘神器

2021-09-28
阅读 3 分钟
1.5k
作者介绍:James Zhang,飞书深诺集团的算法工程师 ,毕业于芬兰坦佩雷大学,感兴趣的方向包括自然语言处理、计算机视觉等机器学习相关领域以及算法工程化。飞书深诺集团是专注海外数字营销解决方案的综合服务集团,为中国出海企业提供可定制组合的全链路服务产品,满足游戏、APP、电商、品牌等典型出海场景需求。
封面图

深度 | 数据大变革,向量数据库大牛揭秘设计理念

2021-09-15
阅读 8 分钟
3.6k
未来 80% 的数据是非结构化的,然而传统的数据分析手段很难挖掘非结构化数据中所蕴含的信息,也没法对这些信息进行统一的表示。如何深入理解这些棘手的「新数据」?Zilliz 研发工程团队「三剑客」郭人通、栾小凡、易小萌共同撰文,探讨了面向 AI 的通用向量数据库的设计和实践,以及当前主要的技术挑战。
封面图

基于Milvus向量引擎的WPS智能写作平台架构实践

2020-06-06
阅读 4 分钟
1.6k
结合当下流行的 NLP 等人工智能相关技术,金山办公软件有限公司武汉 AI 部门自主研发了 WPS 智能辅助写作平台。利用意图识别、文本聚类等语义匹配算法,该平台实现了 AI 辅助用户写稿创作,并具备公文模板、素材推荐和辅助生成等特色功能,同时还实现了公文素材的海量收集,数据规模达到千万级文章、百万级提纲和段落。