AI企业效仿DeepSeek，通过“蒸馏”技术打造更廉价模型

包括OpenAI、微软和Meta在内的领先人工智能公司正在全球范围内采用一种称为“蒸馏”（distillation）的技术，以降低消费者和企业采用AI模型的成本。

蒸馏技术在中国公司DeepSeek使用开源系统构建强大且高效的AI模型后引起了广泛关注。这一突破动摇了硅谷在AI领域的领导地位，导致华尔街投资者从美国大型科技公司的股票中抹去了数十亿美元的价值。

通过蒸馏，公司利用一个大型语言模型（称为“教师”模型）生成句子中的下一个可能单词。教师模型生成的数据用于训练一个较小的“学生”模型，从而快速将大型模型的知识和预测能力转移到较小的模型中。

尽管蒸馏技术已被广泛使用多年，但最近的进展使得行业专家认为，这一技术将为寻求成本效益的初创公司带来巨大好处。OpenAI产品负责人Olivier Godement称蒸馏技术“非常神奇”，能够将大型智能前沿模型的能力转移到更小、更便宜且执行速度更快的模型中。

然而，蒸馏模型在性能上存在一定局限性。微软研究院的Ahmed Awadallah指出，虽然蒸馏模型可以在特定任务（如总结电子邮件）上表现优异，但其能力在其他方面可能受限。

蒸馏技术使得开发者和企业能够以较低的成本访问这些模型的能力，使得AI模型能够在笔记本电脑和智能手机等设备上快速运行。IBM研究院的AI模型副总裁David Cox表示，大多数企业并不需要庞大的模型来运行其产品，蒸馏模型足以满足客户服务聊天机器人或在小型设备上运行的需求。

然而，蒸馏技术也对领先AI公司的商业模式构成了挑战。即使开发者使用OpenAI等公司的蒸馏模型，其运行成本更低，创建成本也更低，因此产生的收入也更少。OpenAI等模型制造商通常对蒸馏模型的使用收取较低费用，因为其计算负载较小。

OpenAI的Godement认为，大型语言模型仍然需要用于“高智能和高风险任务”，在这些任务中，企业愿意为高精度和可靠性支付更多费用。此外，大型模型还需要用于发现新能力，这些能力随后可以被蒸馏到较小的模型中。

尽管如此，OpenAI仍在努力防止其大型模型被用于训练竞争对手。OpenAI有团队监控使用情况，并可以移除其怀疑生成大量数据以训练竞争对手的用户访问权限。然而，这些行动大多是事后进行的。

蒸馏技术也是开源模型倡导者的胜利，开发者可以自由使用这些技术进行构建。DeepSeek最近发布的模型也对开发者开放。Meta的首席AI科学家Yann LeCun表示，Meta将立即使用蒸馏技术并将其应用于产品中，这正是开源的理念。

蒸馏技术意味着模型制造商可以花费数十亿美元提升AI系统的能力，但仍面临快速追赶的竞争对手。IBM的Cox指出，在技术迅速发展的世界中，领先者可能会花费大量资金进行研发，而其他竞争者则紧随其后，这使得AI领域的商业格局变得复杂而有趣。

蒸馏技术为AI模型的成本降低和普及提供了新的途径，同时也对行业领先公司的商业模式和竞争格局提出了新的挑战。随着技术的进一步发展，蒸馏技术有望在AI领域发挥更加重要的作用。