构建机器学习系统的挑战与解决方案

Camilla Montonen在NDC Oslo 2023上讨论了构建机器学习系统的挑战，并强调了MLOps文化的重要性。她指出，构建和维护模型是机器学习系统的主要挑战，而MLOps平台和解决方案虽然提供了构建系统所需的组件，但MLOps的核心在于文化和实践，而非工具本身。

Montonen列举了将机器学习系统部署到生产环境中的一系列挑战，包括：

Montonen解释了机器学习系统的常见组件，包括：

这些组件已成为市场上许多MLOps平台和解决方案的一部分。

Montonen强调，MLOps的核心在于文化，而非工具。她指出，MLOps不仅仅是添加模型注册表或特征存储到技术栈中，而是关注构建和维护系统的人员如何与系统互动，并最大限度地减少摩擦点。这包括：

Montonen建议，我们应努力弥合数据科学和机器学习工程之间的分歧。数据科学优先考虑快速实验和迭代，而机器学习工程则优先考虑版本控制、通过CI/CD管道进行受控交付和部署、自动化测试以及更精心设计的生产代码。

Montonen建议，与其立即采用可能使问题复杂化的MLOps工具，不如从基础开始：

在InfoQ的采访中，Montonen指出，大多数大型MLOps工具提供商起源于工程师在大型语言模型或计算机视觉模型训练项目中的工作，这些工具在这些用例中表现良好。然而，对于中小型企业来说，这些现成组件通常不够灵活，无法应对ML系统中随时间积累的许多独特问题。

Montonen建议，在引入任何工具或解决方案之前，先找出机器学习团队的具体问题。例如：

通过诊断当前问题，可以帮助确定哪些工具能够真正解决问题，并帮助权衡利弊。大多数MLOps工具需要一定的学习、维护和集成努力，因此确保它们解决的问题值得这些投入是非常重要的。