Title
您当前的位置: 首页 > > 文章详细
ER 1.6 让波士顿机器狗瞬间“人模人样”「请名人找他山石」
发布时间:2026-04-16

  他山石智库多年积累诸多顶级专家资源,构建了连接海内外顶级学者的学术网络。进入2026年,我们持续推动前沿技术与产业实践的深度碰撞,旨在通过高水平的学术交流与智力支持,为行业变革提供权威指引与决策参考。

  Google DeepMind 揭开了机器人推理模型 Gemini Robotics-ER 1.6 的面纱。

  最惊艳的一幕出现在工厂里:搭载该模型的波士顿动力机器狗 Spot,不仅能准确走到压力表前停下,还能像熟练工一样读出刻度背后的数字。这不再是简单的“执行指令”,而是物理世界的逻辑推理。

  一、核心进化:从“机械听令”到“空间感知”

  ER 1.6 是 Gemini Robotics 系列的第三代产品。它的定位不是控制肢体的“小脑”,而是负责理解、计划、调用的“高层大脑”。

  1.仪表识别:成功率从 23%到 93%

  以前的 Spot 只能拍照,看不懂数据。ER 1.6 通过 Agentic Vision 实现了三步走:

  局部放大:锁定压力表,看清微小刻度。

  精准定位(Pointing):识别指针与刻度,结合代码计算比例。

  世界知识:将物理信号转化为具有工业意义的读数。

  2. Pointing:空间推理的“点睛之笔”

  Pointing 是 ER 模型的看家本领。ER 1.6 能在杂乱的工具图中准确点数:2 把锤子、1 把剪刀、6 把钳子……一个不差。更聪明的是,它知道如何**“排除干扰”**——图中没有的东西,它绝不瞎指。

  3.成功检测:知道什么时候“收工”

  自动化的难点在于“判断完成”。ER 1.6 强化了多视角推理,它能合并头顶和手腕摄像头的画面,判断“蓝色笔是否真的入筒”,避免因遮挡或光线问题导致的无效操作。

  二、谷歌与波士顿动力:分手九年,终在巅峰重逢

  这不仅仅是技术发布,更是一次产业回流:

  2013-2017:谷歌曾拥有波士顿动力,后因看不到商业化路径将其卖给软银。

  2026 年 1 月:在 CES 上,谷歌宣布与波士顿动力(现归属现代汽车)正式联手。

  哈萨比斯的野心昭然若揭:谷歌不造硬件,而是要做“机器人领域的 Android”,为全球机器人厂商提供通用的大脑。

  三、幕后推手:DeepMind 的精英战队

  ER 1.6 的成功离不开两位核心作者:

  Laura Graesser:强化学习领域的硬核专家,曾研究让机器人在 100 毫秒内完成乒乓球击球。

  Peng Xu:机器人基础模型的大拿,RT-1、RT-2 等里程碑式工作的共同缔造者。

  他们共同遵循一个信念:机器人要真正有用,就必须对物理世界进行推理。

  四、安全防线:物理世界的红线

  作为迄今最安全的机器人模型,ER 1.6 在物理安全约束上表现优异:

  不处理液体。

  不搬运超 20 公斤重物。

  在真实伤害报告的隐患识别测试中,ER 1.6 的表现比 Gemini 3.0 Flash 还要高出 10%。

  他山石智库 2015 年来商业合作数百位诺贝尔奖得主、图灵奖得主、两院院士、藤校牛剑院长教授、世界500强领导者、联合国高层及 openai 创始人等人工智能科学家、经济学家、企业家及《未来简史》作者赫拉利;世界首富马斯克母亲梅耶·马斯克等。为北京、上海、杭州、广州、深圳政府举办的国际化论坛、峰会提供演讲嘉宾;为阿里、腾讯、字节、百度等公司大会提供演讲嘉宾,并运营诺贝尔奖专家领衔的品牌代言背书和海外传播。他山石智库还应用独一无二资源,送数百位中国学子去美国常青藤及前三十大学,英国牛津,剑桥等名校留学。创始团队来自国务院发展研究中心、财新、清华、麻省理工。

上一篇:
深佛携手,粤企出海服务省内行从禅城出发
下一篇:
阿里推「Happy Oyster」模型 可用于电影电视剧制作及游戏开发
Title