OpenAI 文本转视频大模型 Sora 引爆科技圈！人类离 AGI 真的不远了吗？

一年前 AI 智能涌现的场景又重现。

2 月 16 日，OpenAI 发布了最新的视频生成模型 Sora。它能够根据用户输入的提示词、文本指令或静态图像，生成长达一分钟的视频。

这一举动无疑轰动了整个科技圈，从目前 Open AI 展示的信息来看，Sora 实现了 AIGC 领域的里程碑式进展。从仅通过输入一句话，生成文本，再到图片，到现在可生成与好莱坞画面相媲美的视频，且长度最多可达 1 分钟，这让不少科技大佬折服。

Sora 到底有多强？

在官网更新的 48 个视频中，Sora 不仅能准确呈现细节，还可以根据提示、静止图像填补现有视频中的缺失帧来生成视频。其中既能实现多角度镜头的自然切换，还包含复杂的场景和生动的角色表情，且故事的逻辑性和连贯性极佳。

来看看官网更新的其中一个文本生成的视频：

AI 文本提示：一位时尚的女人走在东京的街道上，街道上到处都是温暖的发光霓虹灯和动画城市标志。她身穿黑色皮夹克，红色长裙，黑色靴子，背着一个黑色钱包。她戴着墨镜，涂着红色口红。她自信而随意地走路。街道潮湿而反光，营造出五颜六色的灯光的镜面效果。许多行人四处走动。

在这段仅持续一分钟的视频里，一位穿着鲜艳红裙的女士漫步在繁华都市、五光十色的霓虹灯下。视频的呈现风格极为逼真，画面切换自然流畅，但最令人震惊的，无疑是女主角那细致入微的面部特写。从毛孔的细微张开，到斑点与痘印的真实展现，每一个皮肤细节都栩栩如生，仿佛我们能直接触摸到她的肌肤质感。而那种粉底微脱、妆容稍许不整的效果，显得更加真实！

除了对人物写实，Sora 还能够模拟现实中的动物与环境以及非写实的创意动画等等，其生成效果让网友开始担心起了各行业人士的饭碗。

Sora 的技术原理其实跟 ChatGPT 类似，都是拼接大量的数据和训练，建立起大模型，然后利用强大的算力快速生成内容。

目前主流大模型都是建立在巨大的参数量和运算量之上的，对算力提出了极高的要求，Sora 的横空出世，推动算力需求的持续高涨。训练一个模型需要大量 GPU 服务器。为了提高企业 AI 应用产品的健康快速落地，支撑企业低成本快速使用 AI 算力资源。Finovy Cloud 提供全球先进算力产品和服务引擎，高性能云主机，致力于为企业提供先进的 AI 算力，助企业在 AI 行业中获得发展红利，协力迎接一个更加高效、智能的 AI 新时代到来。

OpenAI 文本转视频大模型 Sora 引爆科技圈！人类离 AGI 真的不远了吗？

FinovyCloud

引用和评论

英伟达 RTX 5090 震撼发布，RTX 4090 会降价吗？

一文掌握 MCP 上下文协议：从理论到实践

AI Agent爆火后，MCP协议为什么如此重要！

AdventureX 2025 正式启动：五天四夜，120小时极限创造！一起在杭州点燃青年创新之火！

MCP 协议为何不如你想象的安全？从技术专家视角解读

🔥吐血整理 Bolt.diy 部署与应用攻略

常见的 AI 模型格式