提质不加价,可灵新版视频生成模型正式登场!
新版本依然是一石激起千层浪,不到24小时就有超过72万次阅读。
我们也带来了新鲜实测!
没有辅助提示词的情况下,2.1版的图生视频相比于前一代1.6普通版,明显内容更加合理了。
△上半部分为2.1新版生成,下半部分为1.6
这一波快手上线了可灵2.1的两个版本,距离上次大更新过了一个多月:
- 2.1普通版:1080/720P,运动更好、细节更到位、更自然、画面更流畅,且主打性价比;
- 2.1大师版:1080P,质量更高,大幅度运动表现更好(价格也更高)。
这也是快手战略调整,成立可灵AI事业部之后,可灵大模型的第一次大更新。
有网友试用之后表示,这就是可灵对Veo3的回应。
模型一片叫好声之余,可灵创造的业绩数据也随着快手最新一季财报新鲜出炉——
今年前三个月,快手靠可灵收入了1.5个亿,超过了去年7月到今年2月可灵的收入总和。
实测可灵2.1
那我们就先来看看超高性价比的2.1普通版,具体又包括了标准的720P和高品质的1080P两种模式。
目前普通版只支持图生视频,文生视频将在之后上线(大师版已支持文生视频)。
这样的顺序背后也有数据作为支持——此前可灵2.0上线时,快手副总裁、可灵AI负责人张迪曾介绍,在使用可灵生成视频的用户当中,有85%使用的是图生视频。
那我们就直接用可灵AI生成的图片来尝试一下。
一只黑白相间的猫追着蝴蝶
图生视频的配套提示词则是这样:
黑白相间的猫轻快地追逐蝴蝶,跑入盛开的花丛中,镜头跟随其动作,花瓣被带动轻轻扬起,阳光明媚的午后
来对比一下2.1普通版的高品质1080P(右)和1.6版本的高品质1080P(左)。
可以看到的是,两个版本对于画面理解的效果都不错,但1.6版本中蝴蝶有两秒像是飘在半空中。
2.1版本中猫的动作更轻快,而且视频中蝴蝶的飞行更灵动,仔细看可以发现,当蝴蝶停在花瓣上时,由于重力的作用,花瓣飘动的幅度更大了,让整个画面有一种“物理真实感”。
看完小猫,再来看一组人物动作细节的对比,首帧图是一个小男孩正在吃手里拿的面包。
这一次图到视频中间不加提示词,直接让模型自由发挥。
1.6版本(下)中,小男孩咬面包的位置和最终面包缺口不太一致,并且咀嚼动作显得“更吃力”。
2.1版本(上)在这两点上没有太大缺点,咀嚼动作更自然。
最细节的是,它保留了小男孩脸上的“小痣”,而这一点被1.6版本(右)的前两秒忽略了!
看完这个单人的细节镜头,再看一组多人物、大场景的例子,还是照例先生成图像:
春节,爷爷奶奶,爸爸妈妈,1个男孩,5个人其乐融融的互相聊天,桌上的菜肴丰富
小男孩站在餐桌旁举起红包向家人展示,爷爷奶奶和爸爸妈妈围坐在摆满菜肴的餐桌前鼓掌微笑,红色的春联在暖黄灯光下微微飘动,五口之家其乐融融地聊天,窗外隐约可见绽放的烟花,固定镜头。
可以看出,“烟花”和“红包”的元素直接被下面的1.6版给忽略了,而2.1则进行了正确复现。
另外在鼓掌的动作上,2.1版本生成的视频看上去也更加真实。
另外,关于可灵2.1大师版,可灵官方也给出了可灵超级创作者的作品作为Demo。
在语义理解上,视频能完整呈现提示词信息,就连虚化的背景都能看出一种动态感。
面部细节更加真实,无论是皮肤状态还是女人说话时面部肌肉的走向,都让人感觉这是能在“真实物理世界”发生的事。
△作者:可灵AI超创@JH4TC
除了新模型的表现之外,价格也值得说道——
可灵这次上新的2.1模型的两个版本,主打一个“提质不加价”,不管普通版还是大师版,都和原来的对应版本保持一致。
- 普通版标准模式(720P),5秒20灵感值,按照单独购买灵感值计算,相当于人民币两块;
- 普通版高品质模式(1080P),5秒35灵感值;
- 大师版(1080P),5秒100灵感值。
虽然数字上还是同样的价格,但生成质量已经不是一个Level,算下来还是更便宜了。
另外在2.0时代,可灵只发了个大师版,也就是说5秒的1080P要花十块钱,而现在标准版高品质模式直接把价格打了下来。
这样算下来,生成高质量1080P视频的成本也下降了。
可灵一季度创收1.5亿
根据Quora(美版知乎)旗下大模型平台Poe最新发布的模型使用趋势报告,今年1-5月,在文生视频领域,可灵系列模型总共占据的份额达到了30%。
并且上个月可灵2.0大师版上线后,榜一大哥Runway的份额几乎腰斩,下降到了23.6%,降幅约四成。
除了获得用户的认可之外,可灵也切切实实地给快手带来了资金收入。
快手刚刚发布的Q1财报显示,今年第一季度可灵AI的收入,超过了人民币1.5亿元。
并且在财报的统计期间内,可灵2.0还未上线。
而据上一期(2024Q4)财报显示,可灵AI自2024年7月启动商业化变现以来,到今年2月的累计收入超1亿元。
财报还透露,可灵AI已经广泛应用于广告营销等领域,今年Q1 AIGC营销素材的日均广告消耗3000万,与上一季基本持平。
可灵AI获得的广泛声誉,加上财报上的优异表现,也促进了快手在AI上的进一步战略调整。
上个月,快手成立了可灵AI事业部,成为一级业务部门,下设成立可灵AI产品部、运营部和技术部,负责可灵、可图等系列大模型业务。
该部门负责人由快手高级副总裁盖坤担任,直接向程一笑汇报。
原先负责可灵大模型研发的社区科学线将继续保留且仍然由盖坤负责,但不再负责可灵视频模型,而是在其之下成立基础大模型与应用部,负责LLM大模型、多模态理解大模型以及应用技术研发。
这次结构调整,无疑凸显了可灵AI在快手战略中的关键地位。
参考链接: [1]https://x.com/Kling\_ai/status/1927972934112662004 [2]https://ir.kuaishou.com/syste...\_kms/assets/2025/05/27/4-47-29/HKEX-EPS\_20250527\_11687207\_0.pdf
— 完 —
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。