OpenAI与DeepSeek的争议及微软的介入
近期,OpenAI指控中国公司DeepSeek在开发其AI模型DeepSeek R1时,违反了OpenAI的服务条款,使用了OpenAI的模型输出。然而,OpenAI的最大投资者微软却在周三宣布,将在其Azure云服务上托管DeepSeek R1。
DeepSeek R1的性能与成本优势
DeepSeek R1在过去一周内成为AI领域的焦点,因为它是一个免费提供的模拟推理模型,据称在性能上与OpenAI的o1模型相当,而训练成本却远低于o1。微软Azure允许开发者租用其数据中心的计算资源,并访问运行在这些机器上的软件。微软公司副总裁Asha Sharma在新闻稿中表示,R1提供了一个强大且成本效益高的模型,使用户能够以最小的基础设施投资利用最先进的AI能力。
DeepSeek R1的成本远低于o1。尽管Azure上尚未提供R1和o1的对比价格,但DeepSeek列出R1的API成本为每百万输出标记2.19美元,而OpenAI的o1则为每百万输出标记60美元。这种巨大的成本差异使得R1在与o1-pro类似的任务中表现出色。
微软托管DeepSeek R1的意义
微软决定在其服务器上托管R1并非罕见,因为Azure AI Foundry服务已经提供了超过1800个模型,供开发者实验并集成到他们的产品中。然而,这一决定在某种程度上为DeepSeek R1提供了合法性,尽管该模型在过去一周内引发了OpenAI的担忧。
争议的核心在于DeepSeek是否使用了OpenAI的模型输出来训练或微调自己的模型,这种做法被称为“蒸馏”,违反了OpenAI的服务条款。自DeepSeek V3(R1的前身)发布以来,用户报告称该模型经常自称为ChatGPT,这表明至少部分ChatGPT生成的数据被用于微调V3的行为。
其他争议与调查
除了服务条款的指控和OpenAI员工的激烈推文外,微软还据称对DeepSeek展开了调查,因为其安全研究人员发现,这家中国公司可能在2024年秋季通过OpenAI的API提取了大量数据用于训练。
OpenAI的回应与未来计划
尽管存在争议,OpenAI CEO Sam Altman本周早些时候对DeepSeek的竞争表示欢迎。他在周一发推文称,DeepSeek的R1是一个令人印象深刻的模型,特别是在其价格方面。Altman还表示,OpenAI将发布更好的模型,并期待新的竞争对手。作为对R1崛起的回应,OpenAI预计将在今天晚些时候通过ChatGPT发布o3-mini。
总结
微软在Azure上托管DeepSeek R1的决定,尽管引发了OpenAI的争议,但展示了该模型在性能和成本方面的优势。同时,DeepSeek被指控违反OpenAI的服务条款,微软也对其展开了调查。尽管如此,OpenAI对DeepSeek的竞争持开放态度,并计划发布新的模型以应对市场变化。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。