谷歌 DeepMind 发布了针对机器人和具身智能的 Gemini Robotics 1.5 系列家族模型,专为机器人和具身智能打造的新一代「大脑」。
此次公布的模型是其核心“ Gemini Robotics 1.5 ”及其“大脑”“ Gemini Robotics-ER 1.5 ”。
Gemini Robotics 1.5,最先进的视觉-语言-行动模型,能将视觉信息和指令转化为机器人的运动指令以执行任务。
Gemini Robotics-ER 1.5,最强大的视觉-语言模型,能够对物理世界进行推理,直接调用数字工具,并创建详细的多步骤计划来完成任务。