大数跨境

中国信通院具身智能基准测试(EAI Bench)第二批评测(Y2026Q1)工作正式启动

中国信通院具身智能基准测试(EAI Bench)第二批评测(Y2026Q1)工作正式启动 CAICT人工智能
2026-04-02
4
导读:欢迎意向企业参与EAI Bench第二批测试

随着具身智能的爆发,行业涌现出各类“炫技式演示”,各家厂商都在不同任务、不同维度上展示各自的成绩。具身智能基准测试致力于打造统一的能力标尺,客观测量技术的发展水平和应用边界,引导行业从混乱的演示内卷走向有序的可持续发展。新闻联播、人民网报道,中国信息通信研究院联合40余家单位共同起草的具身智能领域首个行业标准《YD/T 6770-2026 人工智能 关键基础技术 具身智能基准测试方法》正式发布,该标准为具身智能领域构建了统一基准测试框架,标志着具身智能评测迈入“有标可依”的新阶段。

中国信息通信研究院人工智能研究所(以下简称“中国信通院人工智能所”)于2024年初启动具身智能基准测试(简称“EAI Bench”)工作,以产业共建、国际引领为目标,发布具身智能领域首个行业标准(标准下载地址https://miittc1.caict.ac.cn/standardDetail/?id=7)具身智能基准测试方法”,并在ITU-T推进国际标准立项。同时,依托具身智能测试实验室(北京朝阳)完成具身智能基准测试(EAI Bench)首批测试,并于2025年12月发布可信AI—具身智能基准测试(EAI Bench)首批测试结果(Y2025Q4)

EAI Bench介绍


EAI Bench目前已开放15个场景赛道(见下图),围绕感知行动、决策推理和动作执行三个维度,设置14个泛化能力考察项;涵盖模型和部署模型的整机系统2类评测对象,通过量化τ1~τ3三种干扰强度,考察系统在真实场景下的泛化能力。

为更好地推进EAI Bench工作,中国信通院人工智能所依托具身智能测试实验室(北京朝阳)启动具身智能基准测试(EAI Bench)第二批测试(Y2026Q1)

参测说明


第二批测试预计4月-5月完成,参测流程如图所示:

具身智能基准测试(EAI Bench)参测权益:
权威性:有标可依
  • 具身智能领域首个正式发布的行业标准
  • 已在ITU-T SG21同步推进国际标准
行业影响力:通过测试后将获得
  • 中国信息通信研究院泰尔实验室评测证书
  • 多方位媒体宣发
  • 产业大会结果发布

请有意向参与EAI Bench第二批测试的企业扫描下方二维码报名。



关于可信具身智能评测体系

中国信息通信研究院人工智能研究所构建可信具身智能评测体系,旨在为行业提供统一的技术规范框架,建立产业链上下游间的协同互信基础,推动具身智能从作坊式开发走向产业化发展。

图1 可信具身智能评测体系

可信具身智能评测体系以“研发支撑—关键技术—应用落地—可信保障”为主线,形成四层递进的全栈评估框架。

  • 研发支撑层,聚焦基础设施,包含开发平台、仿真平台、算力控制器及系统控制接口等,支撑模型训练与系统研发

  • 关键技术层,聚焦“数据-模型-本体”三大核心要素,并通过基准测试验证技术能力和真实部署成效。

  • 应用落地层,面向产品制造商、系统集成商和应用服务商提出产品能力要求和服务规范,加速典型应用场景落地和商业闭环转化。

  • 可信保障层,从可靠性、可控性、安全性等维度,构建贯穿感知、决策、交互、行动全链路的可信应用规范,并依托符合性测试和分级测试,为技术研发、硬件制造、场景应用建立统一可信基础。

合作联系人



白老师 15501202911

张老师 13552276063



【声明】内容源于网络
0
0
CAICT人工智能
中国信通院人工智能研究所官方公众号。关注我们,了解中国信通院人工智能工作动态,了解人工智能技术研究、标准制定、评估测试、行业应用、产业发展、监管政策及国际交流等前沿进展。
内容 159
粉丝 1
CAICT人工智能 中国信通院人工智能研究所官方公众号。关注我们,了解中国信通院人工智能工作动态,了解人工智能技术研究、标准制定、评估测试、行业应用、产业发展、监管政策及国际交流等前沿进展。
总阅读4.1k
粉丝1
内容159