DeepMind 发布用于具身推理的 Gemini 机器人技术 - ER 1.5

主要观点:Google DeepMind 推出 Gemini Robotics-ER 1.5 这一用于机器人应用的 embodied 推理模型,可通过 Google AI Studio 和 Gemini API 预览,设计用于物理环境中的空间推理等任务,能输出基于物体大小等的精确 2D 点,开发者可调整思考预算平衡响应延迟和推理准确性,模型有防止不安全计划的保障,虽不直接控制机器人执行器但可调用外部工具执行命令,是双模型系统,合作伙伴和测试者在使用,与其他大型机器人模型相比强调可控推理深度和安全机制,初始反应既有兴趣也有谨慎。
关键信息:模型可通过特定平台预览;用于多种物理任务;能输出精确 2D 点;有思考预算调整;有安全保障;可调用外部工具;是双模型系统;有合作伙伴和测试者;与其他模型对比有优势;引发不同反应。
重要细节:模型地址为 https://developers.googleblog...https://deepmind.google/model...https://www.infoq.com/news/20...;提及 Nvidia VLA 等其他模型;有机器人工程师的关注和担忧;AI 顾问的评价等;在 15 个机器人基准测试中达先进性能等。

阅读 9
0 条评论