中国公司DeepSeek推出开源R1模型,挑战OpenAI
本周,中国公司DeepSeek推出的开源R1模拟推理模型在生成式AI领域引起了广泛关注。尽管使用了较少的计算资源,R1模型的表现与OpenAI的付费模型相当,甚至在某些方面表现更优。这一突破让OpenAI和其他生成式AI企业措手不及。
生成式AI行业的核心假设被打破
自2022年底和2023年初ChatGPT、Stable Diffusion等生成式AI模型公开以来,美国AI行业一直认为,模型的改进需要不断增加训练数据和计算能力,以实现人工通用智能(AGI)。这一假设反映在英伟达的股价、能源投资和数据中心计划等多个方面。DeepSeek的出现是否颠覆了这一假设尚不确定,但至少动摇了投资者的信心,尤其是那些投资OpenAI的投资者。
OpenAI的回应与指控
OpenAI CEO Sam Altman承认DeepSeek R1模型“令人印象深刻”,但OpenAI采取了一系列措施保护其模型(包括语言模型和商业模型)。OpenAI向《金融时报》等媒体表示,他们认为DeepSeek使用了OpenAI模型的输出来训练R1模型,这种方法被称为“蒸馏”。使用OpenAI的模型来训练与之竞争的模型违反了OpenAI的服务条款。
OpenAI的版权争议
OpenAI目前卷入了多起版权侵权诉讼,包括《纽约时报》提起的诉讼,指控OpenAI及其合作伙伴微软未经授权使用其内容。其他作者和艺术家也对OpenAI提起了类似诉讼。尽管OpenAI声称《纽约时报》的内容对其现有模型的训练“没有显著贡献”,但公司仍在与《纽约时报》等新闻机构以及Reddit、StackOverflow等用户生成内容平台和HarperCollins等出版商达成内容协议。
AI模型训练与版权问题
投资公司Andreessen Horowitz在2023年底向美国版权局提交的文件中表示,将AI模型训练视为版权侵权“会颠覆至少十年的投资预期”。该公司认为,AI模型训练“服务于非剥削目的:从作品中提取信息并加以利用,从而‘扩展作品的效用’”。这一观点与OpenAI的行为形成鲜明对比,OpenAI一方面要求保护其模型的专有数据,另一方面却在未经许可的情况下使用他人的作品。
行业对DeepSeek的反应
DeepSeek的成功引发了行业的焦虑,尤其是美国公司担心被中国公司超越。Andreessen Horowitz的创始人Marc Andreessen将DeepSeek的模型称为AI行业的“斯普特尼克时刻”,暗示美国公司需要迎头赶上,否则将面临落后的风险。然而,无论地域如何,OpenAI似乎希望从无限访问他人作品中受益,同时限制他人对其作品的类似访问。
总结
DeepSeek的开源R1模型在生成式AI领域取得了显著突破,挑战了OpenAI等公司的领先地位。OpenAI对此表示关注,并指控DeepSeek使用了其模型的输出进行训练。然而,OpenAI自身也卷入了多起版权侵权诉讼,显示出其在版权问题上的双重标准。DeepSeek的成功不仅动摇了生成式AI行业的核心假设,也引发了关于AI模型训练与版权问题的广泛讨论。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。