这是一篇关于从头开始构建 AI 代理的两部分系列文章的第一篇。
- 本文内容:探索 AI 代理的价值,介绍流行的代理式 AI 平台,并通过实践教程构建一个简单的 AI 代理;第二部分将深入探讨实践教程,构建可自动化任务并与外部工具和 API 交互的代理;“AI 代理”一词在过去 1 年中使用量增加了 10 倍(谷歌趋势)。
- AI 代理应用示例:以规划度假为例,如今预订酒店、航班和租车等是独立进行,规划游玩地点也很耗时且碎片化;而在代理式 AI 世界中,只需给出提示,AI 代理就能立即生成定制的旅行套餐,包括航班、酒店、汽车、美食推荐和优化的行程。
- AI 代理基础:AI 代理是能通过解释环境数据、基于该数据做决策来实现目标,从而自主执行任务的系统,如在度假规划中可自主预订、解读数据、做决策和实现目标。
- 代理式 AI 平台:代理式 AI 框架是创建能自主或半自主通过工具使用和记忆进行推理、规划和行动的 AI 系统的工具包,如 LangChain、CrewAI 和 Phidata 等,本文使用 Phidata 平台,它内置多种工具和大语言模型(LLM),只需几行代码即可构建和部署 AI 代理。
构建 YouTube 总结代理:YouTube 总结代理旨在从 YouTube 视频中提取关键见解和要点,使用 Google Colab 笔记本编写和执行代码,利用 Phidata 代理式 AI 平台提供动力,模型使用 Groq 模型托管平台,工具使用 YouTubeTools 来获取视频数据,代码如下:
from phi.agent import Agent from phi.model.groq import Groq from phi.model.openai import OpenAIChat from phi.tools.youtube_tools import YouTubeTools agent = Agent( # model=Groq(id="llama3-8b-8192"), model=Groq(id="llama-3.3-70b-versatile"), ## Toggle with different LLM model tools=[YouTubeTools()], show_tool_calls=True, # debug_mode=True, description="You are a YouTube agent. Obtain the captions of a YouTube video and answer questions.", ) agent.print_response("Summarize this video https://www.youtube.com/watch?v=vStJoetOxJg", markdown=True, stream=True)输出能准确总结视频内容,但由于 LLM 的概率性质,每次运行结果可能不同。
详细教程:运行上述代码需获取 Groq 模型托管平台的 API 密钥,步骤如下:
- 克隆笔记本:克隆 colab 笔记本这里(需 Google 账号),安装依赖(第一个代码单元格)。
- 获取 Groq 的 API 密钥:前往 Groq 开发者门户[https://console.groq.com],登录或注册,访问 API 部分,生成新的 API 密钥并复制保存。
- 在 Secret Manager 中添加 API 密钥:点击 Colab 左侧的 Secrets(钥匙图标),提供名称为 GROQ_API_KEY,值为复制的 API 密钥,并打开笔记本访问。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用@来通知其他用户。