跳转至

π0.6和GEN-1谁代表未来?乾坤未定,但这条底层赛道浮出水面

公众号: 机器之心 发布日期: 04月17日 抓取日期: 2026-04-18 URL: https://www.jiqizhixin.com/articles/1de6021c-e9d8-4a91-a4b9-255b40524ce6


Title: 图灵也没想到,智能,必须在现实中「活」下来 | 机器之心

URL Source: https://www.jiqizhixin.com/articles/1de6021c-e9d8-4a91-a4b9-255b40524ce6

Markdown Content:

图灵也没想到,智能,必须在现实中「活」下来 | 机器之心

机器之心

Image 1: 机器之心

Image 2: 未登录

登录

Image 3: empty_user 去登录

Image 4文章库Image 5PRO会员通讯Image 6SOTA!模型Image 7AI ShortlistImage 8: new-iconImage 9AI 好好用

Image 10: 机器之心

文章库PRO通讯会员SOTA!模型AI ShortlistImage 11: new-icon

AI 好好用

Image 12登录

Image 13: home

Image 14: logo文章库

Image 15: icon

Image 16: no-user登录

图灵也没想到,智能,必须在现实中「活」下来

0%

Image 17: icon展开列表

AI全方位接管,全链路打通干湿闭环,深势发布玻尔·跃迁实验室

04月17日

AI for Science

Image 18: img

Transformer与RNN合体,谷歌打下显存门槛,解锁超长上下文

04月17日

Transformer

Image 19: img

AI 下半场,由谁来定义?2026 WAIC 云帆奖启航

04月17日

2026 WAIC 云帆奖

Image 20: img

π0.7来了!涌现出组合泛化、跨本体迁移能力,VLA又行了?

04月17日

π 0.7

Image 21: img

SIGIR'26|DPPMG 首创个性化多模态生成新范式:图文一致更懂你

04月17日

DPPMG

Image 22: img

从高端制造到多元公共服务,智平方×西子联合开启具身智能“全场景闭环”新纪元

04月17日

GOVLA

Image 23: img

直播预约 | 世界模型,点燃下一个AI爆点(第二期)

04月17日

世界模型

Image 24: img

图灵也没想到,智能,必须在现实中「活」下来

04月17日

具身智能

Image 25: img

π0.6和GEN-1谁代表未来?乾坤未定,但这条底层赛道浮出水面

04月17日

数据编译

Image 26: img

DeepSeek悄悄更新:Mega MoE、FP4 Indexer来了

04月17日

Mega MoE

Image 27: img

ACL 2026 | OPeRA Dataset: LLM真的能模仿人类行为了吗?首次系统评估LLM的人类行为模拟能力

04月17日

OPeRA Dataset

Image 28: img

短短3个月,高德已拿下具身智能领域15项世界第一

04月17日

Abot-world

Image 29: img

AI能力再进阶,科大讯飞“招采Claw”如何让复杂招采省力合规?

04月17日

2026科大讯飞 AstronClaw升级发布会

Image 30: img

18家具身顶尖势力集结,RoboChallenge 打造全球最大具身模型竞技场

04月17日

RoboChallenge

Image 31: img

Claude Opus 4.7深夜上线,评分碾压

04月17日

Claude Opus 4.7

Image 32: img

表格建模也能Scaling?树模型的时代要改变了

04月17日

Scaling Law

Image 33: img

打造全球领先“具身智能超级供应链”,京东发布行业首个具身数据全链路基础设施

04月16日

京东具身智能生态发布会

Image 34: img

当AI迈入Harness时代:以MiniMax为样本看智能体云端新基建

04月16日

MaxHermes

Image 35: img

数据限制具身?觅蜂杀进场破局:高质量数据水电一样即取即用

04月16日

觅蜂科技(Maniformer)

Image 36: img

TPAMI 2026 | 北大彭宇新团队提出CPL++框架,实现视觉定位模型的「自知之明」和「自我纠错」

04月16日

CPL++

Image 37: img

Image 38: avatar

机器之心 原创

10小时前

图灵也没想到,智能,必须在现实中「活」下来

编辑:吴昕、Youli 第六届 ATEC 科技精英赛 ATEC2026,正式开赛。4 月 1 日,报名通道同步开启,目前正在火热进行中。

作为国内少有的全球性高水平智能科技赛事,本届 ATEC 科技精英赛由 ATEC 前沿科技探索社区联合香港中文大学、上海创智学院共同主办,清华大学、北京大学、复旦大学、香港科技大学、蚂蚁集团等多家单位共同组织。

赛事长期聚焦人工智能、具身智能、网络安全等关键方向,以「真实世界极限挑战」为核心命题,旨在推动前沿技术在复杂物理场景中的实际应用。

ATEC2026 以「AI and Robotics Real-World Extreme Challenge(人工智能与机器人真实世界极限挑战)」为主题,面向全球高校、科研机构、科技企业及极客团队开放报名,重点聚焦具身智能在真实世界中的系统级能力验证。Image 39

具身智能时代的「图灵测试」

具身智能的叙事,正在迅速收敛。「从 Demo 走向真实世界」,已经从口号变成共识。但问题也变得直接:缺的不是想象力,而是验证方式。

环境不可控、任务不可穷举、结果不可标准化,这些现实约束,使得我们很难像评估大语言模型那样,用一套 benchmark 去简单比较强弱。

结果就是,模型很多,但没人知道谁真的更强;Demo 不少,但没人知道能不能真正落地。

因此,把系统放进真实世界,看它能不能跑通,逐渐成为行业最为认可的一种检测方式。毕竟,真实世界本身的复杂性、多样性与随机性,就是最天然、也是最严格的测试集。

ATEC2026,本质上就是在做这件事 —— 搭一个公开的真实世界测试场,在统一规则下,让机器人面对长时序任务和不可预知扰动,接受系统级检验。

「机器人能否真正走出实验室,适应我们复杂的世界。」赛事专家委员会主席、刘云辉院士曾指出,「我们希望通过极限挑战,推动机器人从『演示可行』走向『应用可靠』。」

某种程度上,这更像是一场具身智能时代的「图灵测试」:不看系统会不会做题,而是看它,能在真实世界里「活」到第几集。

赛题考点:不做演示题,只做生存题

在赛题设计上,ATEC2026 将赛题设计的重心置于「系统能否在真实世界中稳定运行」这一命题上,通过三层机制层层递进,构建从「算法演示」到「系统可靠」的评测闭环。

首先是直面「虚实迁移」(sim-to-real)难题,破解「仿真 - 现实鸿沟」

赛事通过「线上仿真 + 线下实景」的双阶段机制,先在统一任务和评测标准下打出可复现的能力基线,再把同一套能力直接拉到真实环境中检验,形成从训练到部署的闭环。

这背后直指具身智能的一个核心问题 —— 仿真性能虚高与演示陷阱。仿真环境可以屏蔽噪声,但真实世界充满不确定性:摩擦在变、光照在变、传感器有噪声,任何一个微小变量都可能让系统失效。

ATEC2026 的做法很直接:把「跨域迁移能力」本身变成赛题,通过「双阶段机制」一致性验证,从实验室走向真实世界,还能不能成立。

其次,摒弃「单点能力」测试,考核长序连续任务

要求机器人一次运行完成「移动 — 感知 — 决策 — 操作 — 执行」的完整链路,核心考察长时序下的稳定性和系统一致性。

在现实环境里生存,从来不是单步执行,而是一条持续展开的链路 —— 移动、感知、决策、操作不断交织。

但当下的大多数评测,仍停留在单点能力的「会不会」:能不能稳定行走,能不能完成一次抓取。这些只能证明能力存在,却回答不了更关键的问题,这些能力,能不能在真实世界中协同运转。

ATEC2026 的设计很明确:不测单点,测闭环。线上阶段验证能力基线与组合能力,线下则要求机器人在真实环境中持续运行,一边移动一边操作,在不确定条件下完成整条任务链。

更关键的是真实环境挑战 —— 决赛直接放到开放户外场景:复杂地形(坡道、台阶、自然路面)、动态扰动、多阶段连续任务叠加,让系统在不可控条件下实时决策。

不同于被精心设计的实验环境,线下尤其是决赛阶段,机器人面对的是开放、动态、非结构化的户外场景,这意味着机器人将进入一个完全没有「预设答案」的自然环境 ——

地形不规则、光照持续变化、环境干扰随机出现,感知、决策与控制随时可能被打断。

而系统必须在无干预条件下,一边移动、一边判断、一边修正,实时完成多阶段连续任务。

ATEC2025 已经验证过一件事:很多在实验室「看起来没问题」的系统,会因各种随机变量,屡遭失效。当环境不再被控制,系统可能因抗扰能力不足或时序逻辑断裂而频繁失效;当环境变量不再被屏蔽,系统的真实鲁棒性与工程可用性,才是决定其能否走向产业落地的唯一标准。

赛题结构:「能力递进」,直至「荒野求生」

刘云辉教授提出的「机器人三大核心能力」—— 行走、操作、改造环境,构成了一套面向真实世界的系统化能力框架。

ATEC2026 正是围绕这一框架,把赛题设计成一条清晰的递进路径:从仿真到真实,从可控到不可控,一层层剥离「演示环境」,直到把系统真正放进现实世界中检验。

本质上,这是在把原本难以量化的「系统能力」和「长程能力」,转化为可以公开比较、反复验证的结果。

对参赛团队来说,这不仅是可以真正验证「整套系统是否成立」的宝贵机会,也是把论文能力,变成真实能力的分水岭。

Image 40: 图片 第一阶段:线上赛,打基线

线上赛分设两个赛道,每个赛道均设置 L0 与 L1 两层任务,覆盖:

  • L0:足式运动 / 桌面操作任务

  • L1:垃圾拾取与投放、越障任务

线上赛任务与线下赛任务在结构上对齐,最终通过客观评分机制自动生成排名。

L0 是能力基线,让不同技术路线在同一标准下对齐与比较;L1 则进一步走向能力组合 —— 以垃圾拾取、越障等任务为载体,要求机器人将感知、决策与执行串成完整闭环。

此时,关注点不再是单个模块的优化,而是整套系统能否真正协同运转。

第二阶段:线下预选赛,验稳定性

进入标准化真实场地(三大分站:中国上海、中国香港、美国匹兹堡),统一赛题与评测标准。机器人需在一次连续运行中完成行走、目标识别与抓取、定点投放等相关任务,重点验证选手:

  • 长时序自主运行能力

  • 运动控制与操作协同能力

  • 系统稳定性与可重复性

将仿真搭建的算法迁移至真实世界中,进入可对照的实地检验环节。

这是从仿真走向现实的第一次落地测试,重点不再是「单点有多强」,而是系统能否稳定、协同、可重复地运行。很多在实验室看起来没问题的方案,往往会在这里第一次暴露断点。

第三阶段:线下决赛,进真实世界

最终进入开放户外环境,难度直接拉满,也是」人工智能与机器人真实世界极限挑战」理念的集中呈现。机器人需在一次连续运行中,完成多阶段任务,包括:

  • 户外越野(长距离行走)

  • 垃圾拾取与投放

  • 越障与环境改造

  • 自主搜索与任务执行

  • 多队竞技任务

多个阶段被压缩进同一条连续任务链中。过去依赖剪辑和分段执行的「展示式能力」在这里失效,机器人必须把从感知到决策、再到执行的能力无缝衔接起来,并持续稳定地运行下去。

这时,问题只剩一个:在不断变化的真实世界中,你的系统还能不能一直做对?

选型开放、奖金奖励总额超 36 万美元

如果你做了一套系统,应该去哪里验证它?ATEC2026,提供了一个目前极为稀缺、又极具分量的答案。

ATEC2026 在机器人具体形态上也高度开放,包括但不限于:人形 / 二轮足机器人(带机械臂) 、四足机器人(带机械臂) 、四轮足机器人(带机械臂)等,长什么样不重要,能不能在真实世界里完成行走、操作与环境交互才重要。

在激励机制上,ATEC2026 不只奖励头部,也覆盖中坚

从线上赛的每个难度层级到线下预选赛、线下决赛,都准备了分阶段的奖金和奖励:

  • 线上赛阶段:L0 与 L1 榜单前 20% 队伍分别平分 15000 美元与 25000 美元奖金池;

  • 线下预选赛阶段:总奖励价值最高可达 150000 美元,各分站赛的冠军队伍和亚军队伍将各获得一套机器人设备;

  • 线下总决赛阶段:冠军独享 150000 美元,亚军获得一套价值 20000 美元的机器人设备。

既拉高上限,也托住中位,让更多真正做系统的团队,有动力跑到最后!

赛程设置

具体的赛程安排如下:

  • 报名时间:2026 年 4 月 1 日 10:00—5 月 30 日 22:00(UTC+8)

  • 线上赛:2026 年 5 月 1 日 10:00—6 月 15 日 22:00(UTC+8)

(线上赛 L1 终榜前 100 名赛队可申报参与线下预选赛。)

  • 线下预选赛:2026 年 9—2026 年 11 月

(线下预选赛共 3 场:上海站 30 进 15,匹兹堡站 10 进 5,香港站 10 进 5,共 25 支队伍晋级决赛。)

  • 线下决赛:2026 年 12 月,将于中国香港进行

(线下决赛设定邀赛队,上限 5 支,因此决赛总参赛队伍上限为 30 支。)

如果你的系统已经做好走出仿真环境,进入真实世界的准备,那么,ATEC2026 报名已经开启!

  • 报名时间:即日起至 2026 年 5 月 30 日

  • 官网入口:ATEC 赛事官网

  • 获取完整赛题与规则说明,请访问官网或扫描下方二维码了解详情!

Image 41: 图片