image

赛默飞世尔(Thermo Fisher)是科学服务领域的世界领导者。其使命是帮助客户使世界更健康、更清洁、更安全。该公司会帮助客户加速生命科学领域的研究、解决在分析领域所遇到的复杂问题与挑战、促进医疗诊断和治疗的发展、提高实验室生产力。

生命科学研究人员在一个正在快速变化的行业里从事着越来越复杂的工作。随着最近对COVID-19大流行的关注,世界各地的科学家都在显微镜下努力工作以便提供有效的治疗方案。赛默飞世尔的原则是,向这些研究人员以及像他们一样的人,向他们提供研究世界最紧迫问题所需的工具和材料。该公司销售的专业产品始终需要个性化的客户体验。他们销售几乎所有与科学工作相关的产品,从实验室用具和化学试剂等日常必需品到基因测序的专门仪器。

基于传统处理方式,该公司由专门商业销售团队通过培训,然后让销售人员针对特定产品采用特定的营销方式。在当今世界中,客户数据来源于许多不同的地方,这使得销售团队越来越难以了解客户需要哪些产品用于他们的研究工作。在过去的三年中,该公司的团队为这些销售团队维护了一个自定义门户,他们可以在其中查看客户的全面的数据信息。这种快速变化的环境为赛默飞世尔提供了一个独特的机会,让他们利用数据科学,在正确的时间为正确的客户提供个性化的产品推荐。

本文由赛默飞世尔的大卫·史密斯撰写,将介绍赛默飞世尔为什么决定使用Amazon Personalize,以及是如何使用的,并如何将决策授权给团队,以及如何在不断发展的生态系统中提供高度个性化的多渠道内容。

第一代推荐系统

我们的团队最初开发了基于规则的推荐系统,该系统基于内部科学家领域知识构建的内容,并在Amazon Redshift集群中使用SQL进行查询。我们这个系统已经构建并使用了一年,而且运行良好,但随着数据量的增长,我们的团队花费了越来越多的时间来维护这个系统。我们觉得目前的基础架构无法跟不上趋势,因此希望迁移到完全无服务器(Serverless)的基础架构,以提高可扩展性和容错性。下图展示了我们的推荐系统架构。

image

我们发现的另一个风险是,为了理解产品与客户的适配关系,我们的推荐必须依赖于内部的内容创建流程。虽然这个工具很强大,但是我们一直在努力提高新产品或最近推出的产品的推荐效果。对于推荐系统来说,这是一个典型的「冷启动」问题,我们对任何新系统的要求之一就是,它可以在不增加维护成本的情况下能够实现新产品的推荐。

自定义推荐系统

我们的团队最初是找的第三方供应商来帮助我们改进推荐系统。但是,我们发现购买解决方案实施成本高昂,而且我们还需要牺牲在商业组织中运营所需的一些灵活性。我们最终决定不购买现成的解决方案。 最终得出的结论是,我们将从头开始构建一个基于自定义机器学习(ML)的系统。我们尝试了几个不同的选项,包括分层循环神经网络(HRNN)模型。最终,我们确定了一个分理化机器(factorization machine)模型,它可以作为性能、易于实现和可扩展性的最佳组合。

个性化推荐

大约8周后,我们结束了模型开发和验证的初始阶段,新系统运行良好。新系统大大改进了我们的预测,并且我们从我们发送的一些示例建议中收到了良好的反馈。当我们的团队了解Amazon Personalize时,我们正准备用新解决方案升级我们的推荐系统。两个月前我们评估了现成的解决方案,在了解Amazon Personalize之后我们立即发现Amazon Personalize在灵活性、可扩展性和可度量性之间拥有理想的平衡。后来我们决定使用Amazon Personalize测试运行一些初始测试,以查看它在真实数据上的表现,并了解实现它需要付出多少努力。我们花了2天时间准备数据、训练模型并开始生成高质量的推荐。

无服务器基础架构

在为科学产品建议设计基础架构时,可扩展性和容错性是我们的首要任务。我们还想要一个系统,使我们能够直观地监控进度和跟踪错误。我们选择使用Amazon Step Function构建我们的推荐推理流程的主干,使用定制的Amazon Lambda函数从我们的Amazon Redshift集群中提取数据,为Amazon Personalize引入数据集做好准备,并触发和监控Amazon Personalize作业。下图说明了此推理流程。

image

不断变化的世界中的灵活性

与许多公司一样,当COVID-19大流行袭来,世界各地的企业转向在家工作政策时,我们的客户的习惯也发生了明显的改变。他们对使用电子邮件广告活动,实现多渠道营销的需求明显增加。我们的团队收到使用我们基于Amazon Personalize构建的推荐系统以实现特定产品电子邮件推荐的需求。尽管我们从未为此计划过,但我们只用了一周时间就将现有的无服务器推理流程进行了修改,以构建、测试和验证一个专门为电子邮件推荐而构建的全新推理流程。需求的快速变化总是具有挑战性的,但我们致力于构建可扩展且灵活的基础架构,这使我们能够克服团队在管理ML部署和基础架构时所面临的许多传统挑战。下图展示了电子邮件推理流程的体系结构。

image
尽管需求的开发时间短,但我们根据这些推荐发送的电子邮件所产生的效果明显要好于之前的基线标准。让我们再回头看下,这是显而易见的,如果我们选择部署自定义的分理化机器模型而不是使用Amazon Personalize,那么满足此次需求的的难度会大大增加。

总结

赛默飞世尔一直努力帮助世界各地的科学家解决我们面临的一些最大挑战。借助Amazon Personalize,我们极大地提高了我们了解客户工作的能力,并通过多种渠道为他们提供个性化体验。使用Amazon Personalize使我们能够专注于解决难题,而不是管理ML基础架构。

image


亚马逊云开发者
2.9k 声望9.6k 粉丝

亚马逊云开发者社区是面向开发者交流与互动的平台。在这里,你可以分享和获取有关云计算、人工智能、IoT、区块链等相关技术和前沿知识,也可以与同行或爱好者们交流探讨,共同成长。