克雷西 发自 凹非寺 量子位 | 公众号 QbitAI
终于!当前的大模型开发生态,被一份报告、完整全景图谱讲清楚了。
就在第十届527蚂蚁技术日上,蚂蚁通过Coding范式、数据、模型部署等角度,对现有开源生态进行了全面完整的大剖析,从数据的视角揭示了大模型开源生态的演进规律,如果你是大模型开发者或者潜在的开发者,几乎研究好这份报告可能就够了。
但这还不够,在报告出炉之前的周末,蚂蚁还发布了2025大模型开源生态全景图,涵盖19个技术领域、135个项目,进一步给出了大模型开发生态的参考系。
报告+图谱,也让这句“大模型开发生态,是一场现实世界的黑客松”,在现场被开发者一遍遍讨论。
是的,在介绍最新的开源生态报告时,蚂蚁开源委员会副主席王旭,就是这么感叹的——
大模型开发生态,是一场现实世界的黑客松。
大模型开源生态,为何是一场实时直播的黑客马拉松?
在去年的QCon(全球软件开发大会)上的报告和量子位的MEET 2025大会中,蚂蚁对开源社区给出了这样的判断:
开源社区的数据可以说既不全面,也不超前于时代,但是,它是跳出公司的一个客观视角。
今年的技术日上,蚂蚁针对开源生态又发布了新的报告,以及新的开源生态全景图。
这张全景图涵盖了一共19个技术领域的135个项目,从模型基础设施层到智能体应用层全面覆盖。
开源开发世界的一个很大的优点是,人可以从公开数据中看到开发者们的协作分布动向,以此模拟项目们在生态之中的关联关系和生态位置。
所以,蚂蚁选取了时下AI领域中大家最耳熟能详的一些项目(例如PyTorch、LangChain、vLLM等),把它们作为种子节点,然后通过开发者在GitHub上的不同项目之间产生的协作关联关系,不断去探查生态的多个侧面。
同时,为了呈现当下最顶尖的和最火热的开源项目,蚂蚁选择了华东师范大学X-lab实验室的OpenRank影响力评价指标作为一个重要的数据依据——只有今年的OpenRank月均值大于10的项目,才会出现在全景图上。
除了这张全景图,蚂蚁还专门列出了2025年排名Top 20的项目,以及增长和下降最明显的项目。
通过对这些项目的分析,蚂蚁开源认为,现在的开源生态中存在着三个主导的技术赛道——模型训练框架、高效推理引擎和低代码应用开发框架。
- 在训练上,PyTorch在全景图中的所有项目中影响力位列第一;
- 在推理上,高效推理引擎vLLM和SGlang在过去一年都处于飞速迭代之中,分别位于OpenRank同比增长的第一和第三位;
- 在应用侧,结合低代码工具链和RAG知识检索管理技术的Dify和RAGFlow,正在高速增长,而这两个应用开发平台都是从中国开发者社区中生长出来的强势项目。
同时,通过这张全景图,蚂蚁开源也发现如今的AI技术扩散速度远超预期,在这样的环境下,大模型开发生态正演变为一场在真实世界发生的、实时公开直播的黑客松。
AI开源生态的七大趋势
从这场“黑客松”当中,开源生态当中的一些趋势也逐渐显现,蚂蚁开源一共总结出了七条,具体可以分为应用和基础设施两个层次。
首先,从应用层,或者说Coding范式上来看:
- Agent框架热潮褪去,低代码开发方式正成为新主流;
- 标准协议层,将成为兵家必争的战略要塞;
- Vibe Coding新范式虽然被“嫌弃”,但开发者已经纷纷“真香”。
虽然AI智能体是当下AI应用领域当之无愧的热门,不过智能体的开发模式相比之前已经发生了很大变化。
具体来说,2025年,Dify、RAGFlow等平台通过低代码工作流和企业级服务的落地开始主导市场;而以LangChain和LlamaIndex为代表的传统开发框架日渐式微。
而Dify一跃而起,成为当前最热门的AI应用开发平台,蚂蚁开源认为其关键在于精准把握了企业级用户的需求——
一方面通过直观的可视化工作流编排大幅降低技术门槛,另一方面则提供完善的企业级安全管控方案。
据此,蚂蚁开源认为,易用性、快速构建或许是当下应用开发框架的关键标签。
框架之外,随着大模型应用进入智能体时代,还需要模型与应用、模型与模型之间的通信标准。
2024年11月,Anthropic开源了MCP(模型上下文)协议,为智能体与工具之间的通信提供了标准化的接口,此后各个大模型都快速跟进并支持了MCP,使之成为了目前实现大模型Agent调用外部工具资源的事实性标准;
今年,Google又开源了智能体间协议(A2A) 协议,规定了不同Agent应用之间的交流和互操作范式,之后CopilotKit又推出智能体用户交互(AG-UI)协议,用于标准化智能体后端调用的工具和前端用户界面之间的交互层。
这些协议无疑是促进大模型应用标准化的重要推动力,但离真正形成完善的体系还有差距,需要原生协议创新。
主导标准制定的先行者,将可通过协议制定权在模型即服务(MaaS)时代构筑生态护城河。
这意味着,随着大模型服务的加速演进,标准协议层会成为头部玩家的战略要塞。
工具层面,被程序员们嘴上嫌弃的Vibe Coding范式已经变成“真香”,并且,一些创业公司或三五人的小团队能够快速产出一个该领域的开源项目,迅速出圈。
并且,AI Coding也正在尝试从一次性代码生成,走向真实的软件工程场景下的开发。
除了应用,蚂蚁报告也从基础设施一侧分析了开源生态现状,得到了以下四大结论:
- 向量索引与存储技术,正在回归理性的沉淀;
- 多模态时代,大数据和AI生态的融合还在路上;
- 模型服务部署与推理的混战仍在持续;
- 大模型的训练生态,仍然以PyTorch为核心。
可以说,蚂蚁的这份报告,对当今的开源生态进行了鞭辟入里的分析,那么,它又能给从业者带来什么样的思考呢?
生态风云变幻,从业者该怎么做?
这些趋势代表了开源生态的一些主流选择,但是并不会凭空产生,其背后存在的共同驱动力依然值得探讨。
从Chatbot到智能体,AI应用的形式变得越来越高端,功能越来越丰富,但基础的技术却在逐步普及化,应用开发门槛反而正在降低。
但技术难度降低带来应用爆发的同时,也让开发者之间的竞争变得更加激烈。
这样激烈的竞争,也正在迫使开源从业者寻找新的差异化路径。
对规模较大、已经掌握部分话语权的开发者来说,从单点工具转向生态控制权,是在竞争中取胜的关键。
比如在七大趋势当中,PyTorch一骑绝尘的核心奥义,正是几乎牢牢把握住了整个模型训练的入口。
趋势中所指出的“探索新的原生标准化形式”,也是基于同样的思路。
当然,生态并不是所有人都有能力建立,事实上,即便是Anthropic这样的MCP提出者,也很难说拥有大模型应用生态的护城河。
那么一般的开发者又该如何获得自己的竞争优势呢?深耕场景、提升用户体验,是一种可行的路径。
前面提到的Dify、RAGFlow等平台,走的就是这一条路线,通过低代码的方式降低了开发使用门槛,可谓是摸准了企业用户的脉门。
更宏观上看,开源生态的发展,也存在着许多“变与不变”。
变化的是,项目周期正在缩短,从业者的试错门槛也在降低,开发模式从“厚积薄发”转向“敢于试错”。
但不变的是,开发者的目标始终是为用户创造价值,而“简化复杂性、提升效率”,就是具体的路径。
总而言之,通过数据化的视角,蚂蚁用135个项目的具体数据,准确捕捉了当前AI开源项目的特征。
通过对七大技术趋势的分析,报告也揭示了大模型开源生态的演进规律,为理解整个生态的发展方向提供了重要参考。
对于具体的技术从业者,这份报告也提供了一个相对完整的大模型开源生态地图,有助于技术选型和趋势判断。
这份报告的意义不在于预测哪个项目会成功或者值得押注,而在于可以帮助理解技术生态演进的内在机制。
也就说是,千遍万遍,规律不变,而这份报告,讲的就是大模型开源生态最底层的基本规律。
报告地址:https://mp.weixin.qq.com/s/2x...\_cDX3Xhyg
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。