深度求索超越“开放权重”AI,计划发布源代码

DeepSeek发布开源代码,推动AI透明度

上个月,DeepSeek通过发布一款具有竞争力的模拟推理模型,在AI领域引起了广泛关注。该模型不仅免费下载和使用,还采用了MIT许可证。现在,DeepSeek计划进一步开放该模型的底层代码,并宣布从下周开始逐步发布五个开源代码库。

DeepSeek的开源计划

在周四晚的社交媒体帖子中,DeepSeek表示,其“开源周”计划将每天发布代码,展示其在线服务中的“基础构建模块”。这些模块已经过文档记录、部署并在生产环境中进行了测试。DeepSeek认为,每一行共享的代码都将成为推动AI发展的集体动力。

尽管DeepSeek并未具体说明将分享哪些代码,但其GitHub页面“DeepSeek Open Infra”承诺,即将发布的代码将涵盖“推动我们小型项目前进的代码”,并以完全透明的方式分享“我们虽小但真诚的进展”。该页面还提到了2024年的一篇论文,详细介绍了DeepSeek的训练架构和软件堆栈。

开源与专有模型的对比

DeepSeek的这一举措进一步凸显了其与OpenAI之间的差异。OpenAI的市场领先产品ChatGPT模型仍然是完全专有的,其内部运作对外部用户和研究人员不透明。而DeepSeek的开源发布不仅有助于更广泛地推广其技术,还能应对其移动应用因隐私问题而面临的国际限制。

开源的深度与透明度

DeepSeek的初始模型发布已经包括了所谓的“开放权重”访问,允许终端用户通过额外的训练数据轻松微调模型参数。然而,目前尚不清楚DeepSeek的开源计划是否包括训练代码。根据开源倡议组织(OSI)的定义,真正的开源AI不仅需要发布训练代码,还需要提供足够详细的训练数据信息,以便有技能的人能够构建一个基本等效的系统。

开源对AI研究的意义

完全开源发布,包括训练代码,可以让研究人员更深入地了解模型的核心工作原理,揭示模型架构中可能存在的偏见或局限性。此外,完全开源发布还使得从零开始复制模型变得更加容易,甚至在必要时可以使用全新的训练数据。

其他开源AI的进展

Elon Musk的xAI去年三月发布了Grok 1的推理代码,并承诺在未来几周内发布Grok 2的开源版本。然而,Grok 3的发布仍然是专有的,目前仅对X Premium订阅者开放。此外,HuggingFace本月早些时候发布了一个开源克隆版,模仿OpenAI的专有“深度研究”功能。尽管该克隆版依赖于闭源权重模型,但其开源代码可以轻松切换到任何开源权重模型。

总结

DeepSeek的开源计划标志着AI领域透明度的一大步,不仅推动了技术的普及,还为研究人员提供了更深入理解AI模型的机会。随着更多公司加入开源行列,AI技术的未来将更加开放和透明。

阅读 11
0 条评论