大规模上网:Orca 探索人工智能代理的人类引导未来

主要观点:UC 圣地亚哥研究人员发布开源系统 Orca,展示大语言模型如何在网页上协助用户,通过引导交互而非控制,提升任务速度和准确性,提供早期证据表明人机循环代理在实际工作流程中的潜力。
关键信息

  • Orca 是协助用户从网页提取有意义洞察的系统,非自主浏览器代理,是决策“副驾驶”/助手。
  • 具备总结长网页、提取非结构化内容结构化数据等功能,可搜索、滚动等交互。
  • 实验室研究中加速网页探索等,参与者能视觉组织页面等,强调共享控制提升信任。
  • Orca 以 Electron 应用实现,前端基于 React,语言能力由 Claude 3.7 Sonnet 模型提供,背后有自定义架构,将网页内容转化为可使用的结构。
  • 开源版本为研究原型,非生产工具,在增加工作量时有性能限制。
    重要细节
  • 在同行评审的白皮书里展示评估效果提升,有八名参与者参与实验室研究。
  • Orca 的“Web Canvas”界面用开源 tldraw 库构建,语言能力由特定模型提供,各功能共享管道且可让用户干预。
  • 同时提到其他类似理念的工具如 OpenAI 的 Operator 和 Opera Neon 浏览器。
阅读 231
0 条评论