0
Gemini Robotics-ER 1.6:谷歌DeepMind推动机器人迈向真实世界智能新时代
在人工智能迅猛发展的今天,机器人不再是科幻电影中单纯执行预设程序的机械臂,而是需要真正"理解"物理世界的智能体。想象一下,一台机器人能在工厂车间自主巡逻,精确读取复杂的模拟压力表、液位计,甚至在多角度摄像头反馈下判断任务是否彻底完成;它还能在杂乱的工作台上准确找出指定工具,避免幻觉错误,同时严格遵守"不要搬动超过20公斤的重物"或"避免接触液体"的安全约束。这一切,正是谷歌DeepMind最新发布的Gemini Robotics-ER 1.6所带来的突破。 Gemini Robotics-ER系列是谷歌DeepMind专为具身智能(Embodied AI)设计的推理优先模型。ER代表"Embodied Reasoning",即具身推理,强调让AI从纯数字世界走向物理行动。1.6版本在1.5基础上实现了质的飞跃,尤其在视觉理解、空间推理和代理能力上大幅提升。它不再是简单的图像识别工具,而是集空间感知、世界知识和动态决策于一体的"机器人大脑"。通过与波士顿动力公司Spot机器人的深度合作,这一模型已能直接应用于工业巡检等高价值场景,标志着机器人从"执行者"向"思考者"的转变。