Meta推出Movie Gen，一款全新的视频生成AI模型

Meta 近日发布了名为 Movie Gen 的新型 AI 模型，旨在生成高质量的 1080p 视频，并实现音频同步。该系统支持基于指令的视频编辑，并允许用户通过上传图片生成个性化内容。

Movie Gen 的核心是一个拥有 300 亿参数 的 Transformer 模型。该模型通过大规模图像、视频和音频数据集进行训练，能够生成每秒 16 帧、时长为 16 秒的视频。此外，模型还整合了 潜在空间管理 和 流匹配技术，显著提升了视频运动的真实感。

Movie Gen 的训练数据包括：

这些数据增强了模型在各种媒体任务中的泛化能力。

在 文本到视频合成、视频个性化 和 视频编辑 任务中，Movie Gen 在多个基准测试中表现优异，超越了包括 Runway Gen3 和 OpenAI Sora 在内的现有最先进模型。具体表现如下：

用户对生成内容的质量和真实感表示高度满意。AI 专家 Alex Volkov 和导演 Ravi Vora 分别表示，Movie Gen 填补了视频生成领域的空白，并可能彻底改变视频制作的方式。

Movie Gen 面临的挑战包括：

Movie Gen 的应用范围广泛，包括：

Meta 计划继续优化模型，未来的更新可能包括扩展的编辑和个性化功能。