大型语言模型与人类语言理解的差异
大型语言模型(如ChatGPT)展示了对话能力,但它们并不真正理解所使用的词汇。这些模型主要通过与从现实世界获取的数据进行交互,而不是直接与现实世界互动。相比之下,人类将语言与经验联系起来。例如,我们知道“热”是什么意思,因为我们在生活中曾经被烫伤过。
能否让AI实现类似人类的理解?
冲绳科学技术研究所的研究团队开发了一种受大脑启发的AI模型,该模型由多个神经网络组成。尽管这个AI模型非常有限,只能学习五个名词和八个动词,但它似乎不仅学会了这些词汇,还学会了它们背后的概念。
机器人手臂的实验
研究团队从发展心理学中获得灵感,试图模拟婴儿如何学习和发展语言。他们为AI提供了一个具身的体验,即让AI在一个能够与世界互动的实际机器人中进行训练。这个机器人配备了一个简单的机械臂和夹持器,能够拾取和移动物体,并通过一个分辨率较低的RGB摄像头提供视觉输入。
自由能量原则
研究团队的起点是自由能量原则,这一假设认为大脑基于内部模型不断对世界进行预测,并根据感官输入更新这些预测。为了在机器人中模拟这一过程,团队使用了四个紧密互连的神经网络,分别负责处理视觉数据、本体感觉、语言处理以及作为关联层预测其他神经网络的输出。
组合性的诞生
2016年,心理学和数据科学教授Brenden Lake提出了一组机器需要掌握的能力,其中之一是组合性,即能够将整体分解为可重用的部分。研究团队的AI模型展示了这种组合性,它能够将学到的命令和动作知识推广到从未听过的命令和未见过的物体组合上。
未来展望
尽管AI模型在有限的工作空间和词汇量下表现出色,但仍有一些问题需要克服。研究团队希望通过增加计算能力来解决这些问题,并计划将系统扩展到具有更多功能和复杂性的类人机器人上。
结论
这项研究表明,通过结合语言、本体感觉、动作规划和视觉,AI可以实现类似人类的理解能力。尽管目前的研究还处于早期阶段,但它为未来开发更智能的机器人提供了重要的启示。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。