OpenAI Sora AI视频生成器发布后引发热议
12月12日,OpenAI新推出的Sora AI视频生成器生成的一段视频在社交媒体上迅速走红。视频中,一位体操运动员在奥运风格的体操表演中突然长出额外的肢体,并短暂失去了头部。这些看似荒谬的合成错误被称为“jabberwockies”,揭示了AI视频生成器的工作原理及其未来改进的可能性。
视频内容与反应
视频展示了一位体操运动员在进行自由体操表演时,身体不断变形,新的肢体迅速出现,甚至一度失去了头部,随后头部又自发地重新连接到身体上。风险投资家Deedy Das在X平台上分享了这段视频,并评论道:“尽管Sora很酷,但体操仍然是AI视频的图灵测试。”这段视频引发了大量幽默反应,例如有人开玩笑称:“我是体操专家,这并不好笑,体操运动员只有在极度痛苦时才会这样做。”
技术细节与问题分析
Sora的工作原理基于训练阶段的神经网络,OpenAI将大量视频(包括体操表演)输入到神经网络中,模型通过统计关联生成预测输出。Sora通过预测下一帧来生成视频,并通过“多帧前瞻”来保持一致性。然而,在处理快速移动的肢体时,模型仍难以正确预测,导致生成的内容缺乏连贯性。
Sora的问题并非个例,所有AI视频生成器在面对超出其训练数据的提示时,都可能产生荒谬的结果。例如,开源AI视频模型Hunyuan Video在生成体操表演视频时,也出现了类似的扭曲和变形。
AI视频生成的挑战与未来
AI视频生成器的核心挑战在于如何通过足够的训练数据和高质量的元数据来生成连贯且逼真的视频。当前的AI模型基于Transformer技术,擅长模仿和转换数据,但在生成真正原创且连贯的内容方面仍有不足。OpenAI通过AI视觉模型描述训练视频,提高了质量,但仍未完全解决问题。
结论与展望
当前的AI视频生成器仍处于早期阶段,尽管存在“jabberwockies”等荒谬输出,但随着训练数据和计算能力的提升,未来有望实现更高质量的生成效果。AI视频生成器的发展轨迹可能类似于AI图像合成模型,从粗糙的抽象形状逐步演变为连贯的影像。在此之前,AI生成的“jabberwocky”疯狂仍将继续带来娱乐和讨论。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。