头图

多年来,创建高质量的视频内容一直是一项复杂、耗时且通常成本高昂的工作,需要电影摄影、剪辑、声音设计和动画方面的专业技能。 生成式 AI,特别是在视频领域,将显著降低这些门槛。 想象一下,通过文本描述或静态图像生成引人注目的补充镜头 (b-roll footage),制作动态的社交媒体动画,甚至制作短小的电影片段。 这就是像 Veo 3 这样的模型所承诺的。

Google 一直是 AI 研究和开发的重要贡献者,并且其对生成式媒体的承诺在通过 Vertex AI 提供的模型的持续发展中显而易见。 Vertex AI 作为一个统一的机器学习平台,提供对 Google 最先进的 AI 模型(包括来自 DeepMind 的模型)的访问,并使用户能够轻松构建、部署和扩展 ML 应用程序。 Veo 3、Imagen 4 和 Lyria 2 的推出进一步巩固了 Vertex AI 作为创意 AI 的强大平台。

Veo 3 介绍:AI 视频生成技术的下一次飞跃

Veo 3 由 Google DeepMind 开发,代表了 Google 视频生成技术的最新进展。 它的目标是为用户提供生成高质量视频的能力,这些视频不仅在视觉上令人印象深刻,而且在听觉细节方面也很丰富。 Veo 3 宣布的主要增强功能和特性包括:

  • 改进的视频质量 (Improved Video Quality): Veo 3 旨在生成由文本和图像提示生成的高质量视频。 这意味着更逼真的纹理、更好的运动连贯性以及对复杂提示细节的更忠实遵循。 该模型能够处理复杂的提示细节,将细微的文本描述转化为引人注目的视觉叙事。
  • 集成语音生成 (Integrated Speech Generation): Veo 3 的一个重大进步是它能够将语音(例如对话和画外音)直接整合到生成的视频中。 此功能为故事叙述、营销内容和教育材料开辟了广阔的可能性,使创作者能够添加另一层叙事深度,而无需单独的音频制作工作流程来处理基本语音。

这些功能的潜在影响已经得到早期采用者的认可。 数字支付领域的领导者 Klarna 一直在利用 Vertex AI 上的 Veo (和 Imagen) 来提高内容创建效率。 他们注意到,从补充镜头到 YouTube 片头动画 (YouTube bumpers) 的资产的生产时间显著缩短。 Klarna 数字体验和增长主管 Justin Thomas 评论了这种转变:“借助 Veo 和 Imagen,我们已将曾经耗时的生产流程转变为快速、高效的任务,使我们能够快速扩展内容创建…… 曾经需要八周的时间,现在只需八个小时,从而节省了大量成本。”

如何使用带有 Vertex AI 的 Google Veo API

Google 的 Veo 模型可在 Vertex AI 上访问,允许您从文本或图像提示生成视频。 您可以通过 Google Cloud 控制台或通过向 Vertex AI API 发出请求与 Veo 交互。 本指南侧重于使用 API,示例主要使用 Gen AI SDK for Python 和 REST 调用。

方法 1:通过 Google Flow 使用 Google Veo 3

img

Google 推出了 Flow,这是一款革命性的 AI 电影制作工具,专为 Google 最先进的模型 (Veo、Imagen 和 Gemini) 定制设计。 Flow 代表了 VideoFX 的演变,并且专门由创意人员构建并服务于创意人员。

https://labs.google/flow/about

Flow 提供的功能:

  • 直观的界面 (Intuitive Interface):使用 Gemini 驱动的提示,用日常语言描述您的愿景
  • 摄像机控制 (Camera Controls):直接控制摄像机运动、角度和视角
  • Scenebuilder:通过连续运动和一致的角色无缝编辑和扩展现有镜头
  • 资产管理 (Asset Management):高效地组织素材和提示
  • Flow TV:浏览不断增长的剪辑展示,其中包含可见的提示和技巧

img

定价和访问:

  • Google AI Pro 计划:提供关键的 Flow 功能和每月 100 次生成
  • Google AI Ultra 计划:提供最高的使用量限制和对 Veo 3 的早期访问权限,其中包含原生音频生成,包括环境声音和角色对话

img

Flow 目前可供美国订阅者使用,更多国家/地区即将推出。 对于想要用户友好界面而无需处理复杂的 API 调用或技术设置的创作者来说,此方法是理想的选择。

方法 2:使用 Google Cloud 注册时提供的 300 美元免费额度

img

https://cloud.google.com/

例如,正如 Google Cloud 网站上所强调的那样,新用户可以获得 300 美元的免费额度以及超过 20 种产品的免费使用权。 这些额度可用于 Vertex AI 上的服务,包括使用 Google Veo 3 模型进行实验。

img

您需要完成注册过程,该过程需要验证:

img

这实际上允许您免费试用 Veo 3,直至达到您的额度或平台的免费套餐限额。 要开始使用,您需要创建一个 Google Cloud 帐户,设置一个项目,并确保已启用 Vertex AI API。

img

通过 API 访问 Veo 3

目前,Veo 3 (veo-3.0-generate-preview) 可通过 Vertex AI API 获得,但需要允许列表访问权限 (allowlist access)。 根据官方文档,此模型处于预览状态,并受到控制访问。

在此处阅读有关 Google 的官方文档的更多信息:

https://cloud.google.com/vertex-ai/generative-ai/docs/models/...

API 访问要求:

  • 加入 veo-3.0-generate-preview 访问权限的等候名单 (waitlist)
  • 该模型支持文本到视频和图像到视频的生成
  • 当前限制:16:9 宽高比、720p 分辨率、24 FPS、8 秒最大长度
  • 每个项目每分钟最多 10 个 API 请求。

方法 3:Google AI Pro 的学生折扣

Google 提供教育折扣和计划,这些折扣和计划可以使学生和教育工作者更容易获得 Veo 3。它的工作原理:

  • 学生可能有资格获得 Google AI Pro 的折扣或免费访问权限
  • 教育机构通常有特殊的定价安排
  • 某些地区提供具有增强额度的特定学生计划

方法 3:Google AI Pro 的学生折扣

Google 提供教育折扣和计划,这些折扣和计划可以使学生和教育工作者更容易获得 Veo 3。

img

它的工作原理:

  • 学生可能有资格获得 Google AI Pro 的折扣或免费访问权限
  • 教育机构通常有特殊的定价安排
  • 某些地区提供具有增强额度的特定学生计划

要获得学生访问权限,您需要:

步骤 1. 在 Google One 注册该计划

https://one.google.com/about/google-ai-plans/

请记住,某些用户可能会遇到此错误:

img

步骤 2. 向下滚动并为大学生选择 15 个月的免费选项

img

步骤 3. 验证学生身份

  • 使用您的教育电子邮件地址 (.edu 域名)
  • 提供学生证或入学证明
  • 检查您的机构是否已建立 Google for Education 合作伙伴关系

重要提示:

  • 资格因地区和机构而异
  • 如果某些帐户不符合当前标准,则可能会显示“此帐户没有资格获得 Google AI Pro 计划”
  • 教育定价和可用性经常变化,因此请查看 Google 教育官方页面以获取当前优惠

步骤 4. 批准您的请求后,转到 Google Gemini 并选择视频选项,您可以在其中立即试用 Veo 3! (当然,有一些限制)

img

如何为 Veo 3 编写更好的提示

img

Google Veo 模型根据您的文本描述生成视频。 更详细的提示通常会产生更高质量和更相关的视频。 考虑描述:

  • 主题和动作。
  • 设置和环境。
  • 电影风格、相机运动。
  • 情绪和语气。

对于支持音频的模型(如 veo-3.0-generate-preview),您可以包含转录 (对话) 和音效的描述。

  • 提示重写器 (Prompt Rewriter) (提示增强):
    Veo 包括一个基于 LLM 的提示增强工具。 此功能可以重写您的提示,以添加更多描述性细节、相机运动、转录和音效,从而实现更高质量的视频输出。
  • 默认启用 (Enabled by Default): 对于诸如 veo-2.0-generate-001veo-3.0-generate-preview 的模型,此功能默认启用。
  • 禁用 (Disabling): 您可以通过在 REST API 调用中将 enhancePrompt 参数设置为 False 来关闭提示增强功能 (或者 SDK 中提供的类似参数,如果可用的话)。
  • 对于 veo-3.0-generate-preview 非常重要: 使用 veo-3.0-generate-preview 模型时,您无法禁用提示重写器。
  • 响应中的重写提示 (Rewritten Prompt in Response): 如果原始提示少于 30 个字,则模型使用的重写提示将在 API 响应中传递。

想要一款出色的 API 测试工具,可生成 美观的 API 文档 吗?

想要一个集成的、一体化的平台,供您的开发团队协同工作,以实现 最高的生产力 吗?

Apidog 提供您所有的需求,并且 以更实惠的价格取代 Postman

结论

Google 在 Vertex AI 上的 Veo 模型代表了生成式 AI 的一项重大进步,尤其是在视频创作方面。 通过 Gen AI SDK for Python 和直接 REST 端点提供直观的 API 访问,Google 使开发人员和创作者能够将强大的文本到视频和图像到视频功能集成到他们的工作流程和应用程序中。


一个幽默的程序员
1 声望0 粉丝