头图

图片
CogVideoX 发布

如果有一个工具能够让你轻松跨越这些障碍,瞬间成为短视频高手,你会心动吗?今天,这个梦想终于成为现实。智谱AI最新推出的CogVideoX,正是为你量身打造的AI视频创作神器!

CogVideoX

CogVideoX是智谱AI于2024年7月26日正式发布的视频生成产品。它采用了DiT(Diffusion+Transformer)架构,并在多个方面进行了技术创新。目前CogVideoX的主要功能有:

支持一键生成多段连续视频,片段连贯
提示词门槛低,中文可用
生成效果优化,能创现实中没有的场景
有文生视频和图生视频模式生成速度快且质量稳定

革命性技术

图片
操作页面展示

CogVideoX的核心魔力来自于其革命性的技术突破。它采用了业界领先的Diffusion+Transformer(DiT)架构,这不仅是一个高大上的名词,更是藏在背后的强大引擎。想象一下,你正在操作一台超级计算机,它能在眨眼间理解你的创意,并将其转化为栩栩如生的视频画面。智谱AI自主研发的三维变分自编码器结构(3D VAE)是CogVideoX的一大亮点。

它能将原始视频数据压缩至原始大小的2%,这意味着更少的存储空间和更快的处理速度。结合3D RoPE位置编码模块,CogVideoX在时间维度上提升了帧间关系的捕捉能力,建立了视频中的长期依赖关系。这听起来很复杂,但对你来说,这意味着生成的视频更加流畅自然,不会出现令人尴尬的卡顿或跳帧。

实操测试

图片
官方发布视频展示

对于那些渴望尝试CogVideoX魔力的用户来说,好消息是你可以在智谱清言的PC端、移动应用端以及小程序端免费体验这项服务。智谱AI推出的AI视频生成功能"清影"(Ying),让所有用户都能轻松体验AI文本生成视频和图像生成视频的服务。

为了帮助用户更好地表达自己的创意,CogVideoX还提供了结构化的提示词公式。例如,你可以使用这样的复杂公式:[镜头语言] + [光影] + [主体 (主体描述)] + [主体运动] +[场景 (场景描述)] +[情绪/氛围/风格]。这种细致入微的控制让AI生成的视频更贴近用户的想象,大大提高了创作效率和满意度。实际测试中,CogVideoX的表现令人印象深刻。无论是内容的连贯性还是对复杂指令的响应速度,都展现出了卓越的性能。

开启自己的AI体验

相比前代模型,CogVideoX在多个方面都实现了显著的提升。最引人注目的是其推理速度,相较于前代模型CogVideo,CogVideoX的推理速度提升了6倍。这意味着用户可以更快地看到自己的创意成果,大大提高了创作效率。

在处理长句子和复杂指令方面,CogVideoX也表现出色。它支持最长226个token的输入,这为用户提供了更大的创作自由度。无论是描述复杂的场景还是细致的动作,CogVideoX都能准确理解并呈现。所以,无论你是专业的内容创作者,还是对视频制作感兴趣的普通用户,都不妨尝试一下CogVideoX。 

有关厚德云

厚德云致力于为用户提供稳定、可靠、易用、省钱的 GPU 算力解决方案。海量 GPU 算力资源租用,就在厚德云。


厚德云
6 声望6 粉丝

厚德云是一个专业的 GPU 算力云平台,专注于为人工智能从业者提供高效、便捷、灵活的 GPU 算力资源租用服务。我们旨在帮助客户加速人工智能的研发和应用进程,实现业务的快速发展。