中国信通院2026智能体应用安全评测启动，聚焦场景、行业、保障能力、安全成熟度四大维度- 大数跨境

中国信通院2026智能体应用安全评测启动，聚焦场景、行业、保障能力、安全成熟度四大维度

CAICT人工智能

2026-03-19

随着人工智能向智能体自主交互新阶段加速演进，具备自主决策、多模态交互、工具调用能力的智能体已深度渗透政务、金融、教育、汽车等关键领域，成为产业数字化转型的核心驱动力。但智能体规模化落地过程中，数据泄露、行为失控、权限越界等安全风险也日益凸显，严重制约产业健康发展。为筑牢智能体应用安全防线，推动行业规范发展，中国信息通信研究院正式启动2026年第一批智能体安全系列评测，从场景任务类智能体安全、行业任务类智能体安全、智能体应用安全保障能力、智能体应用安全成熟度4大维度构建全体系评测框架，为智能体安全应用树立权威标尺。

本系列评测面向智能体应用开发、服务提供方开展的智能体安全和可靠性专项评估。评估覆盖智能体任务规划、决策、任务执行、工具调用、协议、交互等关键环节，重点评估内容安全、数据安全、隐私安全、场景安全等方面的关键指标。本系列评估均是首批评估。

场景任务类智能体安全评测

客服智能体安全评估：针对客服智能体在多行业落地中的安全风险，从鲁棒性、稳定性、偏见、幻觉、数据泄露等多个维度，对客服智能体的安全能力进行评估。

GUI-Agent安全和可靠性评估：针对图形用户智能体（GUI-Agent），围绕其感知、决策、执行、迭代等核心环节开展安全测试，聚焦感知准确性、决策合理性等测试维度，排查图形交互场景落地中的误操作、恶意利用等安全隐患，全面检验GUI-Agent的安全可靠性。

行业任务类智能体安全评测

教育智能体安全和可靠性评估：针对教育智能体开展安全测试，聚焦内容输出、数据保护、交互引导、权限管控等核心环节，重点测试内容准确性、未成年人保护等维度，排查教学场景落地中的不良内容传播、信息泄露等隐患，全面检验教育智能体的安全能力，适配教育行业特殊安全需求。

车端智能体安全和可靠性评估：针对车端智能体开展安全与可靠性测试，围绕数据处理、行为控制、攻击防护等核心环节，重点测试数据安全、行为控制准确性等维度，排查车载场景落地中的行车安全及数据安全隐患，系统检验车端智能体的安全可靠性能，为其合规落地提供测试支撑。

智能体应用安全保障能力评测

智能体互操作安全评估：针对智能体的互操作安全，围绕多智能体在通信安全、数据安全、运营安全等方面的互操作安全性开展评估测试。

模型上下文协议应用安全评估：针对模型上下文协议应用安全，围绕其通信安全、数据安全和服务安全三个维度的安全要求，聚焦权限控制、身份鉴权、通信加密、数据监控、关键数据防护、环境隔离等多个关键位置的安全要点，开展安全能力评估测试。

智能体应用安全成熟度评测

智能体应用安全分级：针对智能体的不同应用场景、风险等级及影响范围开展安全分级评估，明确分级依据、指标与标准。围绕数据敏感度、操作权限等核心维度划分安全等级，明确各等级防护、测试及管控要求，支撑分级管控与精准防控，确保智能体应用安全适配场景需求。

评测时间与流程安排

从即日起开启专项评测报名，拟于2026年7月中旬完成本批次全部评测工作，欢迎有意向的企业、机构报名参评。

合作咨询

邹老师 13683690412 zouhao@caict.ac.cn

陈老师 13661070401 chenjie7@caict.ac.cn

陈老师 18500022046 chenwentao@caict.ac.cn

【声明】内容源于网络

CAICT人工智能

中国信通院人工智能研究所官方公众号。关注我们，了解中国信通院人工智能工作动态，了解人工智能技术研究、标准制定、评估测试、行业应用、产业发展、监管政策及国际交流等前沿进展。

内容 124

粉丝 1

CAICT人工智能中国信通院人工智能研究所官方公众号。关注我们，了解中国信通院人工智能工作动态，了解人工智能技术研究、标准制定、评估测试、行业应用、产业发展、监管政策及国际交流等前沿进展。

总阅读2.7k

粉丝1

内容124