QCon SF:Netflix的大规模搜索与排名系统

Moumita Bhattacharya在QCon SF 2024上关于搜索和推荐系统的演讲总结

演讲概述

Moumita Bhattacharya博士是Netflix的高级研究科学家,她在QCon SF 2024上发表了关于最先进的搜索和推荐系统的演讲。她首先概述了这些系统的典型结构,然后深入探讨了Netflix如何创建一个统一的模型来处理搜索和推荐任务。

问题背景与常规解决方案

Bhattacharya博士首先介绍了问题的背景:许多消费者网站拥有数百万用户和数百万商品,为了提供良好的用户体验,必须帮助用户找到他们感兴趣的商品,无论是通过用户直接搜索还是自动推荐。搜索和推荐这两个问题都可以通过排序来解决,但由于问题的规模,无法实时为每个用户动态排序所有商品。

常规的解决方案是一个两步系统:

  1. 候选生成:从数百万商品中筛选出几百或几千个候选商品。
  2. 排序:对这些候选商品进行排序。第一步需要高召回率,第二步则通常部署复杂的机器学习算法。

Netflix的具体应用案例

Bhattacharya博士探讨了Netflix的两个具体应用案例:

  1. 推荐用例:预测性搜索:由于许多Netflix用户通过电视遥控器与网站交互,输入搜索查询较为困难,因此Netflix尝试预测用户可能输入的查询,并基于此推荐电影。Netflix不仅使用用户的长期历史数据,还使用“会话内”浏览信号来确定用户的当前意图。
  2. 统一上下文推荐器(UniCoRn):这是一个能够处理搜索和推荐任务的单一模型。它支持基于文本的搜索查询(如用户输入电影标题)以及“类似推荐”(基于一部电影推荐其他电影)。Netflix发现UniCoRn在搜索和推荐任务上分别提升了7%和10%的性能。

模型的优势与挑战

虽然统一的模型在性能上有提升,但也存在一些挑战:

  1. 个性化与相关性的平衡:Netflix需要确保个性化不会压倒相关性,并且如何合并这两者是一个重要问题。
  2. 模型大小与推理延迟:由于模型较大,推理延迟是一个挑战。

扩展性问题

当被问及该方案在商品数量更大的领域(如电子商务)中如何扩展时,Bhattacharya博士表示她相信该方案仍然适用,因为模型将在第二步操作,且需要有一个良好的初步检索算法。

总结

Moumita Bhattacharya博士的演讲详细介绍了Netflix在搜索和推荐系统上的创新,特别是通过统一模型UniCoRn提升性能的经验。尽管存在一些挑战,但该模型在处理大规模用户和商品数据方面表现出色,并且具有扩展到其他领域的潜力。

阅读 65
0 条评论