使用 Phidata 构建 AI 代理:YouTube 总结器代理

这是一篇关于从头开始构建 AI 代理的两部分系列文章的第一篇。

  • 本文内容:探索 AI 代理的价值,介绍流行的代理式 AI 平台,并通过实践教程构建一个简单的 AI 代理;第二部分将深入探讨实践教程,构建可自动化任务并与外部工具和 API 交互的代理;“AI 代理”一词在过去 1 年中使用量增加了 10 倍(谷歌趋势)。
  • AI 代理应用示例:以规划度假为例,如今预订酒店、航班和租车等是独立进行,规划游玩地点也很耗时且碎片化;而在代理式 AI 世界中,只需给出提示,AI 代理就能立即生成定制的旅行套餐,包括航班、酒店、汽车、美食推荐和优化的行程。
  • AI 代理基础:AI 代理是能通过解释环境数据、基于该数据做决策来实现目标,从而自主执行任务的系统,如在度假规划中可自主预订、解读数据、做决策和实现目标。
  • 代理式 AI 平台:代理式 AI 框架是创建能自主或半自主通过工具使用和记忆进行推理、规划和行动的 AI 系统的工具包,如 LangChain、CrewAI 和 Phidata 等,本文使用 Phidata 平台,它内置多种工具和大语言模型(LLM),只需几行代码即可构建和部署 AI 代理。
  • 构建 YouTube 总结代理:YouTube 总结代理旨在从 YouTube 视频中提取关键见解和要点,使用 Google Colab 笔记本编写和执行代码,利用 Phidata 代理式 AI 平台提供动力,模型使用 Groq 模型托管平台,工具使用 YouTubeTools 来获取视频数据,代码如下:

    from phi.agent import Agent
    from phi.model.groq import Groq
    from phi.model.openai import OpenAIChat
    from phi.tools.youtube_tools import YouTubeTools
    
    agent = Agent(
      # model=Groq(id="llama3-8b-8192"),
      model=Groq(id="llama-3.3-70b-versatile"),  ## Toggle with different LLM model
      tools=[YouTubeTools()],
      show_tool_calls=True,
      # debug_mode=True,
      description="You are a YouTube agent. Obtain the captions of a YouTube video and answer questions.",
    )
    
    agent.print_response("Summarize this video https://www.youtube.com/watch?v=vStJoetOxJg", markdown=True, stream=True)

    输出能准确总结视频内容,但由于 LLM 的概率性质,每次运行结果可能不同。

  • 详细教程:运行上述代码需获取 Groq 模型托管平台的 API 密钥,步骤如下:

    • 克隆笔记本:克隆 colab 笔记本这里(需 Google 账号),安装依赖(第一个代码单元格)。
    • 获取 Groq 的 API 密钥:前往 Groq 开发者门户[https://console.groq.com],登录或注册,访问 API 部分,生成新的 API 密钥并复制保存。
    • 在 Secret Manager 中添加 API 密钥:点击 Colab 左侧的 Secrets(钥匙图标),提供名称为 GROQ_API_KEY,值为复制的 API 密钥,并打开笔记本访问。
阅读 12
0 条评论