一个新的、未经审查的AI视频模型可能引发新的AI爱好者运动

AI视频生成技术的快速发展

2024年，AI生成视频技术取得了显著进展，OpenAI的Sora、Pika AI的Pika 2、Google的Veo 2以及Minimax的video-01-live等模型相继发布或更新。这些技术的快速发展使得用户难以跟上步伐，更难以全面测试所有模型。在这一背景下，腾讯的HunyuanVideo作为一款开源权重的AI视频合成模型，展现了其独特的优势。

HunyuanVideo的特点与优势

HunyuanVideo的神经网络权重是公开的，这意味着用户可以在适当的条件下本地运行该模型（已有用户展示了在24GB显存的消费级GPU上运行该模型）。此外，HunyuanVideo支持通过LoRAs等技术进行微调，使其能够学习新概念。与其他商业视频模型不同，HunyuanVideo允许生成未经过滤的内容，包括解剖学上逼真的裸体人物视频。

中国公司在AI视频领域的领先地位

2024年，多家中国公司在AI视频领域处于领先地位。专家推测，这一现象可能与中国公司对使用受版权保护的材料、名人图像和未经过滤的视频源进行训练的较少顾虑有关。例如，Stable Diffusion 3在训练数据中包含裸体或色情内容，使得模型在生成人体相关视频时表现更好。

对HunyuanVideo的测试

为了评估HunyuanVideo的性能，我们使用了与Runway的Gen-3 Alpha和Minimax的video-01相同的提示词进行测试。生成的视频长度为5秒，分辨率为864 × 480，每个视频的生成时间约为7到9分钟，成本约为0.70美元。测试结果显示，HunyuanVideo的表现与Gen-3 Alpha和Minimax video-01相当，尽管存在一些瑕疵，如生成的机器人并非动物、猫喝啤酒的罐子透明等。

HunyuanVideo的局限性

尽管HunyuanVideo在某些方面表现良好，但其结果仍然较为粗糙，尤其是在与Google Veo 2等最先进的视频合成模型相比时。此外，HunyuanVideo在处理训练数据中未包含的新场景时仍存在困难，这与市场上其他AI模型类似。

未来展望

未来的HunyuanVideo版本可能会通过改进提示词解释、使用不同的训练数据集、增加训练时的计算能力或改变模型设计来提升性能。尽管目前用户仍需要多次生成才能获得理想的结果，但“开源权重”的AI视频模型似乎已经站稳脚跟，并可能在未来对视频制作等领域产生重大影响。