Claude Opus 4.7深夜上线,评分碾压¶
公众号: 机器之心 发布日期: 04月17日 抓取日期: 2026-04-18 URL: https://www.jiqizhixin.com/articles/08c84a65-e9b4-4bae-9ce8-7637916e266f
Title: 18家具身顶尖势力集结,RoboChallenge 打造全球最大具身模型竞技场 | 机器之心
URL Source: https://www.jiqizhixin.com/articles/08c84a65-e9b4-4bae-9ce8-7637916e266f
Markdown Content:
18家具身顶尖势力集结,RoboChallenge 打造全球最大具身模型竞技场 | 机器之心¶
机器之心¶
![]()
登录
文章库
PRO会员通讯
SOTA!模型
AI Shortlist
AI 好好用

文章库

登录
18家具身顶尖势力集结,RoboChallenge 打造全球最大具身模型竞技场
0%
展开列表
AI全方位接管,全链路打通干湿闭环,深势发布玻尔·跃迁实验室
04月17日
AI for Science

Transformer与RNN合体,谷歌打下显存门槛,解锁超长上下文
04月17日
Transformer

AI 下半场,由谁来定义?2026 WAIC 云帆奖启航
04月17日
2026 WAIC 云帆奖

π0.7来了!涌现出组合泛化、跨本体迁移能力,VLA又行了?
04月17日
π 0.7

SIGIR'26|DPPMG 首创个性化多模态生成新范式:图文一致更懂你
04月17日
DPPMG

从高端制造到多元公共服务,智平方×西子联合开启具身智能“全场景闭环”新纪元
04月17日
GOVLA

直播预约 | 世界模型,点燃下一个AI爆点(第二期)
04月17日
世界模型

图灵也没想到,智能,必须在现实中「活」下来
04月17日
具身智能

π0.6和GEN-1谁代表未来?乾坤未定,但这条底层赛道浮出水面
04月17日
数据编译

DeepSeek悄悄更新:Mega MoE、FP4 Indexer来了
04月17日
Mega MoE

ACL 2026 | OPeRA Dataset: LLM真的能模仿人类行为了吗?首次系统评估LLM的人类行为模拟能力
04月17日
OPeRA Dataset

短短3个月,高德已拿下具身智能领域15项世界第一
04月17日
Abot-world

AI能力再进阶,科大讯飞“招采Claw”如何让复杂招采省力合规?
04月17日
2026科大讯飞 AstronClaw升级发布会

18家具身顶尖势力集结,RoboChallenge 打造全球最大具身模型竞技场
04月17日
RoboChallenge

Claude Opus 4.7深夜上线,评分碾压
04月17日
Claude Opus 4.7

表格建模也能Scaling?树模型的时代要改变了
04月17日
Scaling Law

打造全球领先“具身智能超级供应链”,京东发布行业首个具身数据全链路基础设施
04月16日
京东具身智能生态发布会

当AI迈入Harness时代:以MiniMax为样本看智能体云端新基建
04月16日
MaxHermes

数据限制具身?觅蜂杀进场破局:高质量数据水电一样即取即用
04月16日
觅蜂科技(Maniformer)

TPAMI 2026 | 北大彭宇新团队提出CPL++框架,实现视觉定位模型的「自知之明」和「自我纠错」
04月16日
CPL++

![]()
新闻资讯 原创
13小时前
18家具身顶尖势力集结,RoboChallenge 打造全球最大具身模型竞技场
全球首个大规模具身智能真机评测平台 RoboChallenge,凭借数万次标准化真机测试、客观权威的评测成果,获得全行业高度认可,成为衡量 具身模型物理实操能力的核心标杆。
近日,RoboChallenge 正式完成第二批生态扩容,星动纪元、极佳视界、地平线、光轮智能、生数科技、中移杭研、长虹、算力自由8 家顶尖企业重磅入驻,覆盖算力、仿真、硬件、算法全链条,加速构建开放协同的标准化具身智能产业生态。
今年3月,同步升级的 Table30 V2聚焦真实应用场景,任务难度全面提升,以更高标准推动具身智能技术落地迭代。
破局实验室困境RoboChallenge 打造真实物理考场
具身智能的真正突破,不只来自单点模型能力的提升,更来自评测标准、数据基准与真实本体的共同成熟。长期以来,行业内充斥着精心剪辑的“虚假 Demo”与无法复现的参数神话,缺乏统一的真机测试环境成为了制约技术落地的最大瓶颈。
为此,由 Dexmal 原力灵机联合 Hugging Face 共同发起的 RoboChallenge 应运而生。作为开放式基准测试平台,RoboChallenge 集成了 UR5、Franka Panda、Aloha、ARX-5 等多款主流机器人,首创了大规模远程真机评测机制。其首发任务集 Table 30 精心设计了 30 个日常操作任务,为 Pi0、Pi0.5、OFT 等 6 个主流 VLA 模型提供了标准化测试环境。
为此,由 Dexmal 原力灵机联合 Hugging Face 共同发起的 RoboChallenge 应运而生。作为开放式基准测试平台,RoboChallenge 集成了 UR5、Franka Panda、Aloha、ARX-5、DOS-W1 等多款主流机器人,首创大规模远程真机评测机制。今年RoboChallenge的年度报告显示,平台累计执行的真机测试总量已突破 4 万次。 目前,平台在任务提测、真机执行、日志记录、结果发布等环节已经形成评测闭环,也为深度技术分析筑牢数据根基。除国内开发者外,来自美国、新加坡、日本、阿联酋等多国科研团队和开发者也纷纷入驻参与,RoboChallenge 国际化生态正蓬勃壮大。
早在 2025 年 11 月,RoboChallenge 便携手Hugging Face、智源研究院、智元机器人、Qwen、星海图、清华大学等首批国内外顶尖机构成立组委会。而此次 8 家新伙伴的强势入局,则将从三大核心维度,为这座“真实考场”注入指数级的基建能力。
筑基底层重塑行业“ISO”与算力硬件双核
在具身智能走向千行百业的前夕,构建公允的评测体系与提供强有力的底层算力硬件支持是重中之重。
在硬件本体与端到端算法结合方面,北京星动纪元科技有限公司与北京生数科技将提供关键支持。星动纪元表示,将提供业界领先的灵巧手及机器人本体,并协同提供评测方案,共同构建公允的具身评测体系,指引进化方向。
生数科技计划向 RoboChallenge 线下实验室捐赠机器人硬件与算力,并贡献其在视觉理解、场景重建、世界模型与端到端控制算法上的成果。其开源的世界模型 Motus,相较国际领先的VLA 模型 Pi0.5 实现约 40% 的成功率提升。依托 RoboChallenge 提供的真实场景与多任务测试环境,生数科技也希望进一步推动具身智能从实验室走向真实世界。
北京算力自由科技有限公司以提供稳定可靠的具身智能基础设施为愿景,正式加入RoboChallenge生态。算力自由VP石松表示:“我们选择加入RoboChallenge,核心是为生态内企业与开发者提供不可或缺的高性能算力资源,全面加速具身智能领域的仿真训练、策略学习与基座模型训练,大幅提升研发效率。"同时深度参与社区互动,助力社区生态伙伴举办高校沙龙,赛事合作等,全面推动产学研协同。
跨越 Sim2Real 鸿沟,定义下一代仿真标尺
如何在仿真环境中无限逼近真实物理世界,是降低评测成本、实现规模化泛化的关键。此次入局的多家企业,将在仿真 Benchmark 领域投下“重磅炸弹”。
作为全球首个具身数据独角兽,光轮智能宣布将联合平台打造基于RoboFinals的 Table 30 评测 Benchmark,并表示:“依托首创的‘求解 - 测量 - 生成’三位一体仿真技术,构建数据与仿真基础设施。光轮智能将交付完整可复用的 Table 30 仿真套件,内含 1:1 物理真实的数字孪生资产、参数化仿真任务生成系统及自动化评测工具包,并完成 GR00T N1.5 VLA 开源模型训练,为平台建立强泛化、高一致性的行业参照基线。”
紧贴模型趋势,持续推进测试Benchmark创新
地平线机器人实验室具身操作团队负责人林天威指出:“当前很多 Benchmark 对指令的要求较弱,难以有效评价模型的指令跟随性。”2026 年 6 月,地平线将在 RoboChallenge 上线发布 AnyMove 仿真 Benchmark 及其数据集,系统性、细粒度地测评 VLA 模型的指令跟随与抓取能力,并通过全球开发者社区与顶尖学术会议 Workshop 进行宣发与比赛。
长期深耕世界模型基础的北京极佳视界科技有限公司,则提出了独到的评测路径创新。其首席科学家朱政表示,他们计划推动 RoboChallenge Benchmark 持续升级,创造性地将“世界模型”作为 Evaluator(评估者)引入评测体系,部分代替繁重的真机测试,开辟出真机测试和传统仿真测试之外的第三条高效评测路径。
扎根复杂场景从单一演示走向长程真实服务
具身智能要真正服务人类,必须走出“桌面级”操作,迈向复杂的家庭与商业空间。
为解决家庭服务数据匮乏的痛点,由长虹牵头建设的四川省具身智能机器人训练场重磅入局。研发负责人贾澜鹏宣布,将联合设计发布居家场景基准测试集。该项目将以双足和轮式机器人为本体,1:1 对标地产样板间搭建包含客厅、厨房、卧室的实景,并构建高度还原的 Isaac 虚拟仿真环境。计划于 2026 年底前,产出高达数百小时的真机操作数据,覆盖家电操作、衣物收纳等日常任务,为平台贡献体量极其庞大的 Benchmark 体系。
中移(杭州)信息技术有限公司则将目光投向了极具商业价值的无人餐厅场景。其具身模型团队技术负责人赵永生表示,中移杭研不仅将于今年 6 月开源兼容多种 VLA 模型与异构机器人的异步推理软件框架(VLA-RAIL),更将在 7 月发布面向餐厅场景的 Benchmark Star-Chef v1.0(包含烤面包、倒茶等任务),帮助算法团队突破长序列任务规划瓶颈。同时,他们将依托 GTI 国际组织与中国移动合作伙伴大会,为行业提供全链路的生态赋能。
共建共荣突破具身智能的“最后一厘米”
RoboChallenge 组委会的持续扩容,清晰地折射出具身智能产业的新逻辑:当技术突破进入深水区,单打独斗已成过去,生态共建才是具身智能发展的必然方向。
具身评测体系本质上扮演了行业的“连接者”——它向下连接着底层算力与本体硬件,向上连接着顶尖算法与开发者,向外则连接着未来亿万家庭与工厂的真实场景需求。从最初的几十个桌面任务,到如今涵盖全量物理仿真、长程家庭家务、无人餐厅商业操作的庞大矩阵,RoboChallenge 正以肉眼可见的速度,搭建起具身智能领域的“基础设施大厦”。
“RoboChallenge 第二批生态合作伙伴的加入只是序章。我们的愿景是与全球社区并肩前行。”RoboChallenge 组委会在此次迎新之际重申,“通过构建和维护这个最真实、最严苛、最开放的具身智能‘考场’,我们期望不断降低具身验证的门槛,让每一次算法的失败都转化为工程进步的阶梯。我们欢迎更多有志之士加入这个‘开放共同体’,共同推动具身智能技术突破迈向真实世界的‘最后一厘米’,在物理世界中创造切实、普惠的伟大价值。”
