主要观点:Zhipu AI 发布 GLM-4.5 及 GLM-4.5-Air 新 AI 模型,可在单一架构内处理推理、编码和智能体任务,采用双模式系统切换以提高准确率和速度,GLM-4.5 架构注重深度,训练使用 22T 标记语料,在 12 个基准测试中总体排名第三,在编码基准方面表现突出,早期测试者对其编码和智能体能力称赞,可通过多种方式访问和使用。
关键信息:
- 模型特点:GLM-4.5 有 355B 总参数和 32B 激活参数,GLM-4.5-Air 有 106B 总参数和 12B 激活参数,都使用混合专家(MoE)架构,有“思考”和“非思考”模式。
- 训练情况:在 22T 标记语料上训练,包括 7T 代码和推理标记,用内部 slime RL 基础设施进行强化学习,有异步智能体 RL 训练管道。
- 测试结果:在 12 个基准测试中总体排名第三,在编码基准上表现优秀,如在 SWE-bench Verified 上达 64.2%,TerminalBench 上达 37.5%,工具调用成功率达 90.6%,早期测试者称赞其编码和智能体能力,速度快且语言熟练。
- 使用方式:可直接通过 Z.ai 访问,通过 Z.ai API 调用,或集成到现有编码智能体中,模型权重可在 Hugging Face 和 ModelScope 上获取,支持 vLLM 和 SGLang 推理框架。
重要细节: - GLM-4.5 架构中每层有 96 个注意力头,使用 QK-Norm、Grouped Query Attention、Multi-Token Prediction 和 Muon 优化器。
- 不同用户对 GLM 系列的评价,如在 Scolarius 测试中的表现等。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。