深度求索超越“开放权重”AI，计划发布源代码

DeepSeek发布开源代码，推动AI透明度

上个月，DeepSeek通过发布一款具有竞争力的模拟推理模型，在AI领域引起了广泛关注。该模型不仅免费下载和使用，还采用了MIT许可证。现在，DeepSeek计划进一步开放该模型的底层代码，并宣布从下周开始逐步发布五个开源代码库。

DeepSeek的开源计划

在周四晚的社交媒体帖子中，DeepSeek表示，其“开源周”计划将每天发布代码，展示其在线服务中的“基础构建模块”。这些模块已经过文档记录、部署并在生产环境中进行了测试。DeepSeek认为，每一行共享的代码都将成为推动AI发展的集体动力。

尽管DeepSeek并未具体说明将分享哪些代码，但其GitHub页面“DeepSeek Open Infra”承诺，即将发布的代码将涵盖“推动我们小型项目前进的代码”，并以完全透明的方式分享“我们虽小但真诚的进展”。该页面还提到了2024年的一篇论文，详细介绍了DeepSeek的训练架构和软件堆栈。

开源与专有模型的对比

DeepSeek的这一举措进一步凸显了其与OpenAI之间的差异。OpenAI的市场领先产品ChatGPT模型仍然是完全专有的，其内部运作对外部用户和研究人员不透明。而DeepSeek的开源发布不仅有助于更广泛地推广其技术，还能应对其移动应用因隐私问题而面临的国际限制。

开源的深度与透明度

DeepSeek的初始模型发布已经包括了所谓的“开放权重”访问，允许终端用户通过额外的训练数据轻松微调模型参数。然而，目前尚不清楚DeepSeek的开源计划是否包括训练代码。根据开源倡议组织（OSI）的定义，真正的开源AI不仅需要发布训练代码，还需要提供足够详细的训练数据信息，以便有技能的人能够构建一个基本等效的系统。

开源对AI研究的意义

完全开源发布，包括训练代码，可以让研究人员更深入地了解模型的核心工作原理，揭示模型架构中可能存在的偏见或局限性。此外，完全开源发布还使得从零开始复制模型变得更加容易，甚至在必要时可以使用全新的训练数据。

其他开源AI的进展

Elon Musk的xAI去年三月发布了Grok 1的推理代码，并承诺在未来几周内发布Grok 2的开源版本。然而，Grok 3的发布仍然是专有的，目前仅对X Premium订阅者开放。此外，HuggingFace本月早些时候发布了一个开源克隆版，模仿OpenAI的专有“深度研究”功能。尽管该克隆版依赖于闭源权重模型，但其开源代码可以轻松切换到任何开源权重模型。

总结

DeepSeek的开源计划标志着AI领域透明度的一大步，不仅推动了技术的普及，还为研究人员提供了更深入理解AI模型的机会。随着更多公司加入开源行列，AI技术的未来将更加开放和透明。