GitHub - magnitudedev/magnitude:开源的、以视觉为先的浏览器代理

主要观点:

  • Magnitude 是最先进的,在 WebVoyager 上得分 94%,利用视觉 AI 控制浏览器,能用自然语言操作,具备导航、交互、提取、验证等功能。
  • 可用于自动化网页任务、在应用间集成、提取数据、测试网页应用或构建浏览器代理。
  • 提供了创建项目、设置配置、运行测试等步骤,如 npx create-magnitude-app 及相关配置文件。
  • 解决了传统浏览器代理的问题,如视觉先架构可独立于 DOM 结构进行泛化,可控可重复自动化等。
  • 有额外信息可在文档查看,企业可联系 mailto:founders@magnitude.run 或预约讨论需求,也可加入 Discord 社区获取帮助。

关键信息:

  • 提供视频展示 Magnitude 在终端运行测试和在浏览器中执行动作。
  • 不同操作的示例代码,如创建任务、拖动元素等。
  • 强调需要大型视觉基础模型,推荐 Claude Sonnet 4 及兼容 Qwen-2.5VL 72B。
  • 有 Magnitude 相关的配置文件和示例测试文件。

重要细节:

  • 详细说明了 Magnitude 的各个功能及使用场景。
  • 介绍了创建项目和使用测试 runner 的具体步骤。
  • 提及了传统浏览器代理的问题及 Magnitude 的解决方案。
  • 提供了联系渠道和社区信息。
阅读 33
0 条评论