头图

阅读内容

Inhai: Agentic Workflow:AI 重塑了我的工作流

4 种主要的 Agentic Workflow 设计模式

  1. Reflection(反思):让 Agent 审视和修正自己生成的输出。

举例:如果有两个 Agent:一个负责 Coding,另一个负责 Code Review,效果会更佳。

  1. Tool Use(工具):LLM 生成代码、调用 API 等工具进行操作。

说明:其实是为大模型在获取、处理、呈现信息上做额外的补充。

  1. Planning(规划):让 Agent 分解复杂任务并按计划执行。

说明:通过自行规划任务执行的工作流路径,面向于简单的或者一些线性流程的运行。

  1. Planning(规划):让 Agent 分解复杂任务并按计划执行。

AI Agent 基本框架

OpenAI 的研究主管 Lilian Weng 曾经写过一篇博客叫做《 LLM Powered Autonomous Agents 》,其中就很好的介绍了 Agent 的设计框架,她提出了“Agent = LLM + 规划 + 记忆 +工具使用”的基础架构,其中大模型 LLM 扮演了 Agent 的“大脑”。

2.1. Planning(规划):主要包括子目标分解、反思与改进。将大型任务分解为较小可管理的子目标处理复杂的任务。而反思和改进指可以对过去的行动进行自我批评和自我反思,从错误中学习并改进未来的步骤,从而提高最终结果的质量。

2.2. Memory(记忆):分为短期记忆和长期记忆。其中短期记忆是指的将所有的上下文学习看成是利用模型的短期记忆来学习;而长期记忆是提供了长期存储和召回信息的能力,它们通常通过利用外部的向量存储和快速检索来存储和召回信息。

2.3. Tools(工具):通过学会调用外部不同类型 API 来获取模型(通常在预训练后很难修改)中缺少的额外信息,代码执行能力,访问专有信息源等(例如获取此时此刻的天气、联网网搜索等)。

2.4. Action(动作):根据上述大模型结合问句(Query)、上下文的规划(Context)、各类工具,最终大模型才能决策出最终需要执行的动作是什么。

工作流编排器示例(实战内容,抽卡游戏)

  1. 参考内容:https://www.coze.cn/store/bot/7360966333124804627?panel=1
  2. 复刻了一个完全一样的工作流:https://www.coze.cn/store/bot/7373560901485592612?panel=1&bid...
  3. 感受:用本文流程 输入->处理->反馈->输出 简单描述下就是:
  • 输入:这个例子比较简单,没有输入,只是分析用户的回复,触发工作流,不过工作流是支持数据库、知识库等内容的输入;
  • 处理:通过分析任务,将处理过程拆分成多个处理节点,然后每个节点通过输入、输出串联起来;
  • 反馈:节点的输入可能来自于上一个节点的输出,可以通过代码、大模型等方式控制反馈方式;
  • 输出:通过组合各处理接地那的输出,来按规则输出最终的内容。

简单的和写代码类似,一个个组件相当于api调用,有入参和返回值,然后通过任务拆解来组合各种api并合理的串联起来最终形成一个工作流来完成处理任务。

AI 与人的协同关系

生成式 AI 的人机协同分为 3 种产品设计模式:Embedding(嵌入式)Copilot(副驾驶)Agent(智能代理),在这 3 种模式下,人与 AI 的协作流程也是有所差异。

  1. Embedding 模式:人类完成大多数工作。
  2. Copilot 模式:人类和 AI 协同工作。
  3. Agents 模式:AI 完成大多数工作。

工作流的底层能力

CoT(Chain of Thought) 的思维:“Let's think step by step。”(让我们一步一步思考)

总结

每个人都是独特的个体,应该先摸清楚自己的日常工作流是怎么样的,然后通过每一个工作节点线索,去找到适合你自己使用的工具。


醉舞经阁
1.8k 声望7.1k 粉丝

玉树临风,仙姿佚貌!