Jim Zemlin 开源社KAIYUANSHE
在 2023 年 5 月,一位未透露姓名的谷歌 AI 工程师的备忘录泄露,迅速在科技新闻圈传播,Hacker News 上收获了数千条评论。备忘录标题为“我们没有护城河……OpenAI 也没有”。其核心内容是:不要再专注于构建下一个巨型模型,而是要与开源社区合作,因为他们最终会击败我们。
“我们一直在关注 OpenAI。谁将跨越下一个里程碑?下一步会是什么?但不舒服的真相是,我们在这场军备竞赛中并没有胜算,OpenAI 也一样。在我们争吵的时候,第三方正在悄悄地夺走我们的市场。我说的就是开源。简单来说,他们已经超过我们。我们认为的‘主要未决问题’今天已经给解决,并且在大众手中。”
这篇文章最初是对 Meta 发布首个可用 Llama 模型的回应,随后迅速衍生出许多针对特定用途的变种。那时,开源模型在多个方面往往落后于闭源模型,需要几个月才能达到同等水平。然而,当时的趋势已经显而易见。如今,在即时 AI 模型和 DeepSeek 的时代,这种市场响应时间的优势缩短到了 24 小时。开源 AI 不仅在胜利,而且发展速度如此之快,以至于 Sam Altman 公开承认他可能需要追求更严格的开源策略(我的日历随时为你开放,Sam!)。
我上周写到 DeepSeek及开源 AI 为何在短期和长期内会胜出,预测 DeepSeek 所强调的方法将引发 AI 模型的快速创新浪潮。即便那时,各公司已在开发 DeepSeek R1 基础模型的更可靠和商业可行版本,导致股市大跌。几天后,OpenAI 发布了自己的高级研究产品 Deep Research。这结合了一个大型语言模型(可从 OpenAI 目前提供的 LLM 列表中选择,如 4o、o1、o3 等)和一个“代理框架”,指示 LLM 如何使用工具,如网络搜索,或如何将其过程组织成逻辑步骤。
该工具旨在进行高级推理,像研究分析师一样工作,提供几乎任何主题的复杂分析。AI 专家 Ethan Mollick 对此赞不绝口,许多在线人士称其为他们见过的最佳通用代理工具。
一天后,HuggingFace 发布了 Deep Research 的开源版本,虽然尚未完全可比,但已十分接近。HuggingFace 还在努力重建 R1 缺失的部分,如数据集和训练代码。Deep Research 无疑受益于 DeepSeek 及其 R1 模型的数据、基础模型和训练。这正是开源 AI 如此灵活和强大的原因。(可以看看 AI2 的 Nathan Lambert 对此的看法[1]。)开源的设计没有护城河,反而促进了整体的进步。
与此同时,社区中出现了五个其他开源 Deep Research 竞争对手(dzhng、assafelovic、nickscamara、jina-ai 和 mshumer——感谢 HuggingFace 的发现)。到你阅读这篇文章时,可能会有更多 AI 开发者发布更新和改进的版本。能力的快速复制令许多人感到惊讶,但我并不意外。开源创新的速度显著快于闭源创新,几十年来我们在 Linux 基金会见证了这一点,开源软件正在吞噬软件世界。明确一点,开源软件本身并没有做任何事情。它只是源代码。世界上最优秀的开发者以开放、科学的同行评审模式进行贡献和合作,产生了更好的软件,许多其他开发者选择使用开源软件,因为它比替代品更好。
Pull down that drawbridge because the tide is rising.
Jim Zemlin
这一切的底线是什么?开源 AI 正在加速。社区快速匹配任何新发展的能力,清楚地验证了开源 AI 的速度和力量,这得益于全球庞大而不断增长的人才社区。更重要的是,任何 AI 创新被锁在瓶子里的难度将变得极其挑战。模型蒸馏的进步——即使用一个较大、复杂的模型训练一个更小、更高效的版本——使研究人员能够更有效地剖析公开的 AI 系统。通过蒸馏,可以提取关键的训练见解,使开发相当或更高效的模型成为可能。这种能力不仅加速了研究和开发,还通过让更广泛的社区参与实验和改进现有模型,拓宽了创新生态系统。DeepSeek 利用蒸馏提升了 Qwen 和 Llama 系列模型的推理能力,有效增强了它们在推理任务上的表现。
几乎在同一时刻,斯坦福大学的研究人员发布了一篇论文[2],展示了一种简单的方法,仅需 26 分钟的训练时间和 30 美元的成本,就能将一个开放的 LLM 转变为推理模型(当然,基础模型的成本要高得多)。秘密在哪里?给它提供 1,000 个结构良好的推理示例,扩展其思维过程。使用这种简单(而且现在公开已知)的方法,他们几乎能够匹敌 GPT o1 在匹配问题上的表现。
由于开源中的基础 AI 能力迅速加速,价值将向上流动,流向能够提供最佳安全性、易用性以及开发者和消费者体验的提供者。这应被视为一个伟大的胜利。仅仅一年前,许多科技界人士担心世界正在分化为拥有 GPU 的富人和没有 GPU 的穷人——那些能接触到强大 AI 的人和不能的人。我们已经可以看到这一点并不成立,这一点很重要。各国、各类公司和非政府组织对 AI 能力的民主化访问将成为未来多年中创新的基础构建块,跨越多个领域。开放在推动共同利益的技术上总是获胜。
参考资料
[1]看法: https://www.interconnects.ai/...
[2]论文: https://arxiv.org/pdf/2501.19393
转载自丨LFAPAC
编辑丨王军
相关阅读 | Related Reading
奥特曼:在开源AI上,我们错了!DeepSeek让OpenAI优势不再,下一个是GPT-5
开源:人工智能的 “共享单车时刻” - 以DeepSeek为例看技术普惠革命
开源社简介
开源社(英文名称为“ KAIYUANSHE ”)成立于 2014 年,是由志愿贡献于开源事业的个人志愿者,依 “贡献、共识、共治” 原则所组成的开源社区。开源社始终维持 “厂商中立、公益、非营利” 的理念,以 “立足中国、贡献全球,推动开源成为新时代的生活方式” 为愿景,以 “开源治理、国际接轨、社区发展、项目孵化” 为使命,旨在共创健康可持续发展的开源生态体系。
开源社积极与支持开源的社区、高校、企业以及政府相关单位紧密合作,同时也是全球开源协议认证组织 - OSI 在中国的首个成员。
自2016年起连续举办中国开源年会(COSCon),持续发布《中国开源年度报告》,联合发起了“中国开源先锋榜”、“中国开源码力榜”等,在海内外产生了广泛的影响力。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。