2月18日,头部大模型创业公司阶跃星辰宣布开源了文生视频模型Step-Video-T2V,Gitee AI 第一时间上线了该模型的在线体验。
Serverless API 页面现也已新增视频生成分类及Step-Video-T2V模型入口:
输入 Prompt 后稍等片刻即可获得生成的视频,视频支持下载至本地:
话不多说,直接看看效果:
Prompt:几只巨大的长毛猛犸象穿过一片白雪覆盖的草地,它们长长的毛茸茸的皮毛在风中轻拂,远处是白雪覆盖的树木和的雪山,午后的光线与缕缕的云和远处的太阳创造了温暖的光芒。
Prompt:一个20多岁的年轻人坐在天空的一片云上读书。
Prompt:火车在城市郊区行驶,站在车内能看到车窗上的倒影。
你还有什么创意?现在就去 Gitee AI 试试看吧!
Step-Video-T2V:性能领跑全球开源视频生成大模型
据阶跃星辰公布的数据,Step-Video-T2V模型的参数量达到 300 亿,可以直接生成 204 帧 540P 分辨率的高质量视频。这意味着生成的视频内容具有极高的信息密度和强大的一致性。
为了对开源视频生成模型的性能进行全面评测,阶跃发布并开源了针对文生视频质量评测的新基准数据集Step-Video-T2V-Eval。
该测试集包含 128 条源于真实用户的中文评测问题,旨在评估生成视频在运动、风景、动物、组合概念、超现实、人物、3D 动画、电影摄影等 11 个内容类别上质量。
测评结果显示,Step-Video-T2V的模型性能在指令遵循、运动平滑性、物理合理性、美感度等方面的表现均显著超过市面上既有的效果最佳的开源视频模型。
在生成效果上,Step-Video-T2V 在复杂运动、美感人物、视觉想象力、基础文字生成、原生中英双语输入和镜头语言等方面具备强大的生成能力,且语义理解和指令遵循能力突出,能够高效助力视频创作者实现精准创意呈现。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。