跳转至

Sony Ace机器人Nature封面 - 乒乓球击败职业选手

来源: 量子位 | 2026-04-23 论文: Nature (封面文章) | s41586-026-10338-5


核心突破

索尼AI的乒乓球机器人Ace登上Nature封面,成为首个在完整国际乒联规则下击败人类职业选手的机器人系统。

战绩时间线

时间 对手 结果
2025年4月 日本elite级选手(5位, 3女2男) 3胜2负, 13局赢7局
2025年4月 职业选手(2位T联赛现役) 0胜2负, 7局抢1局
2025年12月 平真由香(2019美国公开赛女单亚军) 获胜
2026年3月 木原美悠(WTT世界排名25)等3位职业选手 获胜

关键差异: Ace是正经实打处理旋转球,而非此前伯克利/港大方案只打平球。


系统架构: 看+想+做

1. 感知层 — 10.2毫秒延迟

视觉系统: - 9台APS相机环绕球台,每台配FPGA本地处理 - 二维小球检测 → 压缩传输 → 中央服务器三维定位 - 空间误差: 3毫米

旋转检测 (关键创新): - 索尼事件相机(event-based vision sensor) — 仅画面变化像素上报 - gaze control system: 3块可转镜片追球 + 电控变焦长焦镜头 - 从3个角度追踪球上logo翻转 → 计算角速度 - 刷新率: 400-700Hz | 平均误差: 24.8弧度/秒

2. 决策层 — 深度强化学习

策略架构: - 每32毫秒(31.25Hz)读取球和机械臂状态 - SAC算法(Soft Actor-Critic) + privileged critic设计

关键训练技巧: - critic训练时获得仿真真值(参考答案) - policy只获得带噪声的传感器历史(模糊照片) - 学生被迫自学传感器融合和轨迹预测 - 完全仿真训练 → 真机零样本部署

Peter Dürr(SonyAI Director)承认最初不信纯仿真可行,结果被结果打脸。

3. 执行层 — 定制机械臂

硬件规格: - 8自由度: 2直线关节(前后左右平移) + 6旋转关节(球拍姿态/速度) - Scalmalloy合金3D打印 + 拓扑优化 - 电机1毫秒同步,位置跟踪延迟<5毫秒 - 最大挥拍速度: 20米/秒 (对标职业选手正手强攻)

球拍配置: - 蝴蝶D05胶皮 + VICTAS ZX-GEAR OUT底板 - 与日本职业选手同级别套胶

端到端延迟: 20.2毫秒 (人类顶级球员: 230毫秒,相差10倍)


历史背景: 索尼机器人20年轮回

日本机器人黄金时代 (1999-2006)

年份 产品 意义
1999 AIBO机器狗 3000美元,20分钟售罄,15万只
2003 QRIO 全球首款双足奔跑人形机器人
同期 本田ASIMO 与各国政要握手敲钟

2006年1月26日: 索尼一天内砍掉AIBO和QRIO两个项目。 2018年: ASIMO停产。 千叶县光福寺: 每年为报废AIBO办超度法事,一次800只。

2025年格局剧变

  • 全球人形机器人出货1.3万台,中国占90%+
  • 前六名全是中国公司,日本无一家上榜
  • 机器人已是中美游戏

Ace背后的坚持

Hiroaki Kitano (北野宏明) — AIBO之父: - AIBO和QRIO被砍后未离开,坚守近20年 - 熬到这篇Nature封面 - Ace共同作者

"虽然形态上还是一台不会动的机械臂,虽然窗外的中国人形机器人已经在春晚上扎堆跑武术。但能回到牌桌,可能已经很好了吧?"


技术对比: Ace vs 伯克利/港大

维度 Sony Ace 伯克利HITTER 港大SMASH
旋转处理 处理旋球 ❌ 只打平球 ❌ 只打平球
对手级别 职业选手 陪练配合 室外环境
端到端延迟 20.2ms - -
训练方式 纯仿真→真机 - -
传感器 事件相机+APS - -

与具身智能大格局的关系

技术路线

Ace代表专用机器人路线 — 针对特定任务(乒乓球)深度优化,而非通用具身智能。

与VLA/世界模型的对比

  • Ace使用经典强化学习(SAC) + 工程化感知/执行系统
  • 与当前火热的VLA(视觉-语言-动作)、世界模型路线不同
  • 证明任务专用系统在特定场景仍可达SOTA

日本机器人产业信号

  • Ace是索尼重返机器人牌桌的标志
  • 但形态上仍是机械臂,非人形
  • 中国在人形机器人出货量上已遥遥领先

Alpha含义

  1. 专用机器人仍有价值: 在特定任务(乒乓球)上,专用系统可击败通用方案
  2. 感知技术突破: 事件相机+gaze control为高速运动场景提供新范式
  3. 仿真到真机: privileged critic训练技巧验证了纯仿真训练的可行性
  4. 日本产业信号: 索尼重返机器人领域,但形态和规模与中国有差距
  5. 非直接标的: 索尼(SONY)机器人业务占比极小,非核心投资逻辑

相关页面