Meta 的 AI 负责人表示,世界模型是实现“人类水平的 AI”的关键,但可能还需要 10 年时间
当今的人工智能模型真的能像人脑一样记忆、思考、规划和推理吗?一些人工智能实验室会让你相信它们是的,但根据 Meta 首席人工智能科学家 Yann LeCun 的说法,答案是否定的。不过,他认为,通过采用一种称为“世界模型”的新方法,我们可以在十年左右的时间内实现这一目标。
今年早些时候,OpenAI 发布了一项名为“记忆”的新功能,让 ChatGPT 能够“记住”你的对话。这家初创公司最新一代的模型 o1在生成输出时会显示“思考”一词,OpenAI 表示,同样的模型还能够进行“复杂推理”。
这一切听起来好像我们离通用人工智能 (AGI) 已经很近了。然而,在最近哈德逊论坛 (Hudson Forum) 的一次演讲中,LeCun 驳斥了人工智能乐观主义者的观点,例如 xAI 创始人埃隆·马斯克 (Elon Musk) 和谷歌 DeepMind 联合创始人 Shane Legg,他们认为人类级别的人工智能指日可待。
“我们需要能够理解世界的机器;能够记住事物、具有直觉、常识、能够像人类一样推理和计划的机器,”LeCun 在演讲中说道。“尽管你可能已经从一些最热情的人那里听到过这些,但当前的人工智能系统还做不到这些。”
LeCun 表示,如今的大型语言模型 (LLM),比如 ChatGPT 和 Meta AI 所支持的模型,还远远达不到“人类级别的人工智能”。他后来表示,人类可能还需要“几年甚至几十年”才能实现这一目标。(不过,这并没有阻止他的老板马克·扎克伯格问他 AGI 何时会出现。)
原因很简单:那些 LLM 通过预测下一个标记(通常是几个字母或一个短词)来工作,而当今的图像/视频模型正在预测下一个像素。换句话说,语言模型是一维预测器,而 AI 图像/视频模型是二维预测器。这些模型在各自的维度上已经变得非常擅长预测,但它们并不真正了解三维世界。
正因为如此,现代人工智能系统无法完成大多数人类可以完成的简单任务。LeCun 指出,人类在 10 岁时学会收拾餐桌,在 17 岁时学会开车——而且只需几个小时就能学会。但即使是当今世界上最先进的人工智能系统,建立在数千或数百万小时的数据之上,也无法在现实世界中可靠地运行。
所有六个阶段议程均包含大量宝贵见解——AI、金融科技、Builders、Disrupt、SaaS 和 Space。
为了实现更加复杂的任务,LeCun建议我们需要构建能够感知周围世界的三维模型,并围绕一种新型的AI架构:世界模型。
“世界模型是你对世界如何运作的心理模型,”他解释道。“你可以想象你可能采取的一系列行动,你的世界模型将让你预测这些行动对世界的影响。”
考虑一下你自己头脑中的“世界模型”。例如,想象一下看到一间乱糟糟的卧室,想把它打扫干净。你可以想象把所有的衣服都收起来收拾好就可以了。你不需要尝试多种方法,也不需要先学习如何打扫房间。你的大脑会观察三维空间,并制定一个行动计划,以便在第一次尝试时就实现你的目标。这个行动计划就是人工智能世界模型所承诺的秘密武器。
这样做的好处之一是,世界模型可以比 LLM 吸收更多的数据。这也使得它们需要大量计算,这也是云提供商竞相与 AI 公司合作的原因。
世界模型是目前许多人工智能实验室都在追逐的伟大理念,这一术语正迅速成为吸引风险投资的下一个流行词。一群备受推崇的人工智能研究人员,包括李飞飞和贾斯汀·约翰逊,刚刚为他们的初创公司 World Labs 筹集了 2.3 亿美元。这位“人工智能教母”和她的团队也坚信世界模型将解锁更加智能的人工智能系统。OpenAI 还将其未发布的Sora 视频生成器描述为世界模型,但尚未详细说明。
在2022 年的一篇关于“目标驱动型人工智能”的论文中,LeCun 概述了使用世界模型创建人类级人工智能的想法,尽管他指出这一概念已有 60 多年历史。简而言之,将世界的基本表示(例如脏乱房间的视频)和记忆输入到世界模型中。然后,世界模型根据这些信息预测世界将会是什么样子。然后,你给世界模型设定目标,包括你想要实现的世界的改变状态(例如干净的房间)和护栏,以确保模型不会为了实现目标而伤害人类(请不要在我打扫房间的过程中杀死我)。然后,世界模型会找到一个动作序列来实现这些目标。
据 LeCun 介绍,Meta 的长期人工智能研究实验室 FAIR(基础人工智能研究)正在积极致力于构建目标驱动的人工智能和世界模型。FAIR 过去曾为 Meta 即将推出的产品开发人工智能,但 LeCun 表示,该实验室近年来已转向专注于长期人工智能研究。LeCun 表示,FAIR 现在甚至不再使用法学硕士学位。
世界模型是一个有趣的想法,但 LeCun 表示,我们在将这些系统变为现实方面尚未取得很大进展。从目前的情况来看,还有很多非常棘手的问题需要解决,他说这肯定比我们想象的要复杂得多。
“我们需要几年甚至十年的时间才能让这里的一切运转起来,”LeCun 说。“马克·扎克伯格一直问我这需要多长时间。”
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。