微软开源Agent操作系统 :深度集成 Windows多智能体

北京

UFO²是一个基于Windows的桌面智能代理操作系统(AgentOS)。它能够将自然语言请求转化为可靠的、跨应用的自动化工作流程。

主要功能点

  • 深度集成Windows操作系统,支持UIA、Win32和WinCOM等多种控制检测和原生命令
  • 支持图片-in-图片桌面模式,在虚拟桌面上运行自动化任务,不影响主屏幕使用
  • 结合原生API和模拟点击键盘等操作,实现快速可靠的混合GUI和API执行
  • 采用推测性多步骤执行,减少与语言模型的交互次数,提高效率
  • 融合文档、搜索、用户演示和执行跟踪等多种知识源,持续学习和提升能力

技术栈

  • Python >= 3.10
  • 支持OpenAI和Azure OpenAI等主流语言模型
  • 结合UIA和视觉控制检测技术
  • 基于RAG(Retrieval Augmented Generation)的知识融合

许可证

本项目采用MIT许可证发布

阅读 494
0 条评论