我同意OpenAI的观点：未经许可不应使用他人的作品 - SegmentFault 思否

我同意OpenAI的观点：未经许可不应使用他人的作品

发布于 1 月 31 日

中国公司DeepSeek推出开源R1模型，挑战OpenAI

本周，中国公司DeepSeek推出的开源R1模拟推理模型在生成式AI领域引起了广泛关注。尽管使用了较少的计算资源，R1模型的表现与OpenAI的付费模型相当，甚至在某些方面表现更优。这一突破让OpenAI和其他生成式AI企业措手不及。

生成式AI行业的核心假设被打破

自2022年底和2023年初ChatGPT、Stable Diffusion等生成式AI模型公开以来，美国AI行业一直认为，模型的改进需要不断增加训练数据和计算能力，以实现人工通用智能（AGI）。这一假设反映在英伟达的股价、能源投资和数据中心计划等多个方面。DeepSeek的出现是否颠覆了这一假设尚不确定，但至少动摇了投资者的信心，尤其是那些投资OpenAI的投资者。

OpenAI的回应与指控

OpenAI CEO Sam Altman承认DeepSeek R1模型“令人印象深刻”，但OpenAI采取了一系列措施保护其模型（包括语言模型和商业模型）。OpenAI向《金融时报》等媒体表示，他们认为DeepSeek使用了OpenAI模型的输出来训练R1模型，这种方法被称为“蒸馏”。使用OpenAI的模型来训练与之竞争的模型违反了OpenAI的服务条款。

OpenAI的版权争议

OpenAI目前卷入了多起版权侵权诉讼，包括《纽约时报》提起的诉讼，指控OpenAI及其合作伙伴微软未经授权使用其内容。其他作者和艺术家也对OpenAI提起了类似诉讼。尽管OpenAI声称《纽约时报》的内容对其现有模型的训练“没有显著贡献”，但公司仍在与《纽约时报》等新闻机构以及Reddit、StackOverflow等用户生成内容平台和HarperCollins等出版商达成内容协议。

AI模型训练与版权问题

投资公司Andreessen Horowitz在2023年底向美国版权局提交的文件中表示，将AI模型训练视为版权侵权“会颠覆至少十年的投资预期”。该公司认为，AI模型训练“服务于非剥削目的：从作品中提取信息并加以利用，从而‘扩展作品的效用’”。这一观点与OpenAI的行为形成鲜明对比，OpenAI一方面要求保护其模型的专有数据，另一方面却在未经许可的情况下使用他人的作品。

行业对DeepSeek的反应

DeepSeek的成功引发了行业的焦虑，尤其是美国公司担心被中国公司超越。Andreessen Horowitz的创始人Marc Andreessen将DeepSeek的模型称为AI行业的“斯普特尼克时刻”，暗示美国公司需要迎头赶上，否则将面临落后的风险。然而，无论地域如何，OpenAI似乎希望从无限访问他人作品中受益，同时限制他人对其作品的类似访问。

总结

DeepSeek的开源R1模型在生成式AI领域取得了显著突破，挑战了OpenAI等公司的领先地位。OpenAI对此表示关注，并指控DeepSeek使用了其模型的输出进行训练。然而，OpenAI自身也卷入了多起版权侵权诉讼，显示出其在版权问题上的双重标准。DeepSeek的成功不仅动摇了生成式AI行业的核心假设，也引发了关于AI模型训练与版权问题的广泛讨论。

I agree with OpenAI: You shouldn’t use other peoples’ work without permission

https://arstechnica.com/ai/2025/01/i-agree-with-openai-you-shouldnt-use-other-peoples-work-without-permission/

阅读 12

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。