微软现在托管被指控抄袭OpenAI数据的AI模型 - SegmentFault 思否

微软现在托管被指控抄袭OpenAI数据的AI模型

发布于 1 月 31 日

OpenAI与DeepSeek的争议及微软的介入

近期，OpenAI指控中国公司DeepSeek在开发其AI模型DeepSeek R1时，违反了OpenAI的服务条款，使用了OpenAI的模型输出。然而，OpenAI的最大投资者微软却在周三宣布，将在其Azure云服务上托管DeepSeek R1。

DeepSeek R1的性能与成本优势

DeepSeek R1在过去一周内成为AI领域的焦点，因为它是一个免费提供的模拟推理模型，据称在性能上与OpenAI的o1模型相当，而训练成本却远低于o1。微软Azure允许开发者租用其数据中心的计算资源，并访问运行在这些机器上的软件。微软公司副总裁Asha Sharma在新闻稿中表示，R1提供了一个强大且成本效益高的模型，使用户能够以最小的基础设施投资利用最先进的AI能力。

DeepSeek R1的成本远低于o1。尽管Azure上尚未提供R1和o1的对比价格，但DeepSeek列出R1的API成本为每百万输出标记2.19美元，而OpenAI的o1则为每百万输出标记60美元。这种巨大的成本差异使得R1在与o1-pro类似的任务中表现出色。

微软托管DeepSeek R1的意义

微软决定在其服务器上托管R1并非罕见，因为Azure AI Foundry服务已经提供了超过1800个模型，供开发者实验并集成到他们的产品中。然而，这一决定在某种程度上为DeepSeek R1提供了合法性，尽管该模型在过去一周内引发了OpenAI的担忧。

争议的核心在于DeepSeek是否使用了OpenAI的模型输出来训练或微调自己的模型，这种做法被称为“蒸馏”，违反了OpenAI的服务条款。自DeepSeek V3（R1的前身）发布以来，用户报告称该模型经常自称为ChatGPT，这表明至少部分ChatGPT生成的数据被用于微调V3的行为。

其他争议与调查

除了服务条款的指控和OpenAI员工的激烈推文外，微软还据称对DeepSeek展开了调查，因为其安全研究人员发现，这家中国公司可能在2024年秋季通过OpenAI的API提取了大量数据用于训练。

OpenAI的回应与未来计划

尽管存在争议，OpenAI CEO Sam Altman本周早些时候对DeepSeek的竞争表示欢迎。他在周一发推文称，DeepSeek的R1是一个令人印象深刻的模型，特别是在其价格方面。Altman还表示，OpenAI将发布更好的模型，并期待新的竞争对手。作为对R1崛起的回应，OpenAI预计将在今天晚些时候通过ChatGPT发布o3-mini。

总结

微软在Azure上托管DeepSeek R1的决定，尽管引发了OpenAI的争议，但展示了该模型在性能和成本方面的优势。同时，DeepSeek被指控违反OpenAI的服务条款，微软也对其展开了调查。尽管如此，OpenAI对DeepSeek的竞争持开放态度，并计划发布新的模型以应对市场变化。

Microsoft now hosts AI model accused of copying OpenAI data

https://arstechnica.com/ai/2025/01/microsoft-embraces-openai-competitor-deepseek-on-its-ai-hosting-service/

阅读 8

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。