随着人工智能技术加速向现实世界场景渗透,以OpenClaw为代表的智能助手正从概念验证迈向规模化应用。智能助手通过将复杂操作指令转化为对本地或远程系统的直接操控,实现从“信息处理”到“任务执行”的能力跨越,成为重塑人机交互范式与产业数字化发展格局的关键动能。
为推动智能助手技术发展与产业应用向深向实,中国信通院人工智能研究所依托人工智能关键技术和应用评测工业和信息化部重点实验室和中国人工智能产业发展联盟智能体创新与应用工作组,联合产学研多家单位共同编制了《智能助手基准测试通用框架》技术规范。中国信通院现正式启动2026年可信AI智能助手(Claw)基准测试首批评估工作。具体评估范围如下:
1
基础能力
聚焦智能助手人机交互与任务执行核心环节,评估智能助手在理解交互、逻辑推理、检索核验、规划执行、状态记忆和工具技能等方面的能力。
2
应用能力
聚焦智能助手落地应用实效,评估智能助手在软件工程、数据分析、文档处理、流程执行、创意写作、文件管理和网页操作等方面的能力。
3
综合能力
聚焦智能助手规模化部署与系统化运营,评估智能助手在多渠协作、工程运行和合规对齐等方面的能力。
图 1 智能助手(Claw)基准测试技术规范框架
联系人
王老师,18755879708
wangyiru@caict.ac.cn
胡老师,15052927319
huyixuan@caict.ac.cn
张老师,15722924458
zhangxueqiang@caict.ac.cn

