UFO²是一个基于Windows的桌面智能代理操作系统(AgentOS)。它能够将自然语言请求转化为可靠的、跨应用的自动化工作流程。
主要功能点
- 深度集成Windows操作系统,支持UIA、Win32和WinCOM等多种控制检测和原生命令
- 支持图片-in-图片桌面模式,在虚拟桌面上运行自动化任务,不影响主屏幕使用
- 结合原生API和模拟点击键盘等操作,实现快速可靠的混合GUI和API执行
- 采用推测性多步骤执行,减少与语言模型的交互次数,提高效率
- 融合文档、搜索、用户演示和执行跟踪等多种知识源,持续学习和提升能力
技术栈
- Python >= 3.10
- 支持OpenAI和Azure OpenAI等主流语言模型
- 结合UIA和视觉控制检测技术
- 基于RAG(Retrieval Augmented Generation)的知识融合
许可证
本项目采用MIT许可证发布
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。