随着具身智能的爆发,行业涌现出各类“炫技式演示”,各家厂商都在不同任务、不同维度上展示各自的成绩。具身智能基准测试致力于打造统一的能力标尺,客观测量技术的发展水平和应用边界,引导行业从混乱的演示内卷走向有序的可持续发展。新闻联播、人民网报道,中国信息通信研究院联合40余家单位共同起草的具身智能领域首个行业标准《YD/T 6770-2026 人工智能 关键基础技术 具身智能基准测试方法》正式发布,该标准为具身智能领域构建了统一基准测试框架,标志着具身智能评测迈入“有标可依”的新阶段。
中国信息通信研究院人工智能研究所(以下简称“中国信通院人工智能所”)于2024年初启动具身智能基准测试(简称“EAI Bench”)工作,以产业共建、国际引领为目标,发布具身智能领域首个行业标准(标准下载地址https://miittc1.caict.ac.cn/standardDetail/?id=7)“具身智能基准测试方法”,并在ITU-T推进国际标准立项。同时,依托具身智能测试实验室(北京朝阳)完成具身智能基准测试(EAI Bench)首批测试,并于2025年12月发布可信AI—具身智能基准测试(EAI Bench)首批测试结果(Y2025Q4)。
EAI Bench介绍
EAI Bench目前已开放15个场景赛道(见下图),围绕感知行动、决策推理和动作执行三个维度,设置14个泛化能力考察项;涵盖模型和部署模型的整机系统2类评测对象,通过量化τ1~τ3三种干扰强度,考察系统在真实场景下的泛化能力。
为更好地推进EAI Bench工作,中国信通院人工智能所依托具身智能测试实验室(北京朝阳)启动具身智能基准测试(EAI Bench)第二批测试(Y2026Q1)。
参测说明
第二批测试预计4月-5月完成,参测流程如图所示:
-
具身智能领域首个正式发布的行业标准
-
已在ITU-T SG21同步推进国际标准
-
中国信息通信研究院泰尔实验室评测证书
-
多方位媒体宣发
-
产业大会结果发布
请有意向参与EAI Bench第二批测试的企业扫描下方二维码报名。
关于可信具身智能评测体系
中国信息通信研究院人工智能研究所构建可信具身智能评测体系,旨在为行业提供统一的技术规范框架,建立产业链上下游间的协同互信基础,推动具身智能从作坊式开发走向产业化发展。
图1 可信具身智能评测体系
可信具身智能评测体系以“研发支撑—关键技术—应用落地—可信保障”为主线,形成四层递进的全栈评估框架。
研发支撑层,聚焦基础设施,包含开发平台、仿真平台、算力控制器及系统控制接口等,支撑模型训练与系统研发
关键技术层,聚焦“数据-模型-本体”三大核心要素,并通过基准测试验证技术能力和真实部署成效。
应用落地层,面向产品制造商、系统集成商和应用服务商提出产品能力要求和服务规范,加速典型应用场景落地和商业闭环转化。
可信保障层,从可靠性、可控性、安全性等维度,构建贯穿感知、决策、交互、行动全链路的可信应用规范,并依托符合性测试和分级测试,为技术研发、硬件制造、场景应用建立统一可信基础。
合作联系人
白老师 15501202911
张老师 13552276063

