微软推出全能型多代理系统Magentic-One

Microsoft 宣布推出 Magentic-One，这是一个全新的通用多智能体系统，旨在处理涉及网络和文件环境的开放式任务。该系统专注于提高跨多个领域的复杂多步骤任务的效率，例如软件开发、数据分析和网络导航。

Magentic-One 采用多智能体架构，由一个 Orchestrator 智能体协调四个专用智能体：

该系统基于模块化设计原则，使智能体能够独立运行并适应新任务，而无需对系统进行重大更改。Magentic-One 构建在 Microsoft AutoGen 开源框架上，支持多种大型语言模型（LLMs），包括 GPT-4o。

Magentic-One 在 GAIA、AssistantBench 和 WebArena 等基准测试中使用 AutoGenBench 进行评估。结果显示，该系统在管理复杂工作流方面表现出色，与其他先进解决方案相比具有竞争力。

Microsoft 强调，智能体系统可能存在意外操作和系统滥用的风险。在开发过程中，识别了诸如重复登录失败和试图寻求外部人类帮助等场景。为降低风险，系统包括安全部署指南、红队演练以及人类监督建议。

Magentic-One 的发布引发了 AI 社区的广泛关注。LLM 专家 Elvis Saravia 在 X 上评论道：

虽然还处于早期阶段，但构建通用智能体系统的新趋势值得关注。此外，像 RAG 这样的当前基于 LLM 的应用也将受益于这种建立在多个专用智能体之上的系统。

Reddit 用户 Alexian\_Theory 分享道：

该系统的网页浏览方法很有趣。它会对运行的无头浏览器进行截图，将图像传递给支持视觉的 LLM，然后决定如何进一步完成任务。

Magentic-One 及其评估工具 AutoGenBench 的代码现已开源。Microsoft 鼓励研究人员和开发者合作改进智能体 AI 系统，重点关注安全性、操作可逆性以及在实际应用中最小化风险。

多智能体编排系统的开发正成为 AI 行业的核心焦点。多家大公司在这一领域做出了贡献：

这些系统都旨在协调多个智能体以高效解决复杂的多步骤任务，标志着模块化和协作式 AI 架构的日益重要。