为贯彻落实国家人工智能发展战略,推动智能体技术标准化与产业化协同发展,提升智能体在终端部署、多智能体协同、网络安全等关键场景中的技术规范与安全保障能力,根据《中华人民共和国标准化法》《国家标准化发展规划》等规定和要求,经中国国际科技促进会标准化工作委员会评审,现决定启动“人工智能大模型 智能体”系列团体标准研制工作。
项目背景
人工智能(AI)作为新一轮科技革命和产业变革的核心驱动力,既是技术创新的前沿,也是全球竞争的战略高地。当前,我国正处于加快培育新质生产力、全面推进高质量发展的关键阶段。AI正迈向智能体时代,实现从思考到行动的质变,从“单轮对话”的工具形态,向具有感知、规划、决策、执行能力的“智能体”形态演进。以大模型为“大脑”的智能体,正在从“工具附庸”转变升级为“智能协作者”,有望重塑人机协作方式,推动生产效率变革。目前,智能体已成为实现通用人工智能的关键路径,其在智能制造、智慧城市、个人助理、网络安全、科学研究等领域的应用潜力巨大。然而,智能体产业的爆发式增长也面临着严峻挑战:
技术碎片化:智能体技术尚处于发展早期,各大厂商和研究机构在架构设计、接口定义、能力评估等方面缺乏统一规范,导致系统兼容性差、开发效率低下、成本高昂。部署复杂性:将智能体能力有效部署在资源各异的终端设备(如手机、电脑、车载设备、家用电器)上,是技术价值变现的最后一公里。目前终端智能体部署面临终端硬件算力、内存、功耗等多元化,智能体持续更新、状态监控和故障恢复在分布式边缘环境面临调整等问题。安全信任危机:智能体具备感知、决策和自主执行能力,其“自主性”也是一把双刃剑,带来前所未有的安全、伦理与可控性风险,包括行为失范、决策“黑箱”、数据泄露、恶意滥用等,严重制约其在高价值场景的落地。数据根基不牢:高质量数据集是训练和评估智能体的“燃料”,与传统大模型相比,智能体数据更强调序列决策、工具调用、环境交互和多轮对话等能力。智能体的持续学习与精准执行高度依赖高质量、场景化的训练与评估数据,但目前缺乏针对智能体任务特性的数据集构建标准。
为顺应技术趋势、引导产业健康发展、防范重大风险、加速价值落地,打通技术堵点、降低协同成本、筑牢安全底线、夯实数据根基,为我国在全球智能体技术竞争中赢得先机提供标准保障,亟需加快建立“人工智能大模型 智能体”标准体系。
项目主要内容
人工智能大模型 终端智能体通用技术要求
主要内容:本标准规定终端智能体的功能架构(如感知理解、任务规划、工具调用、记忆机制、人机交互等)、性能要求(响应延迟、决策准确率、资源占用)、与底层大模型的接口规范、在资源受限环境下的自适应能力要求。
拟解决问题:终端智能体功能定义不统一、能力边界模糊问题,产品性能比对困难、用户体验参差不齐问题;智能体与不同大模型适配成本高、移植性差问题。
人工智能大模型 终端智能体部署要求
主要内容:本标准规范智能体在终端设备部署环境的适配与配置规范(如操作系统、硬件加速器)、运行资源(CPU/内存/存储/网络)管理与调度策略、模型与组件(模型轻量化、量化、推理引擎选择与优化要求)、运维保障(监控、更新与维护机制)等内容。
拟解决问题:解决终端智能体在多样化、异构化硬件环境中部署复杂、稳定性差的问题;解决系统管理不当导致卡顿、功耗过高、主功能受限等问题;解决智能体版本迭代与故障恢复困难、运维成本高的问题。
人工智能大模型 多智能体互联技术要求
主要内容:本标准规范多智能体的通信消息格式与协议、任务协同与谈判机制、身份认证与权限管理、系统架构与接口标准,以及一致性与性能测试方法。
拟解决问题:解决不同来源、不同架构智能体间通信和协作问题;解决多智能体协同中因规则缺失导致的任务冲突、责任不清、效率低下的问题;为跨组织、跨平台复杂智能体系统提供互操作基础。
人工智能大模型 网络安全智能体 检测能力评估规范
核心内容:本标准规范网络安全领域的智能体检测能力的覆盖范围(如恶意代码、网络入侵、异常行为)、评估指标体系(检出率、误报率、响应时间、自动化程度)、基准测试环境构建、以及分级评估准则。用于客观衡量和认证网络安全智能体的实战能力。
拟解决问题:解决各类网络安全智能体能力夸大、效果难以衡量的问题;为用户选型提供科学、公正、可复现的评估依据;引导网络安全智能体朝着检验更准、响应更快、自动化程度更高的方向发展。
人工智能大模型 智能体安全通用技术要求
主要内容:本标准智能体的数据安全与隐私保护(贯穿数据输入、处理、输出全流程)、行为安全与可控性(防止越权操作、恶意指令执行)、算法安全与伦理合规(避免偏见、保障决策透明可解释)、以及全生命周期的安全风险管理要求。
拟解决问题:解决智能体自主性带来的越权操作、被恶意利用、决策偏见等问题;建立智能体安全基线,防范数据泄露与隐私侵权;提升智能体透明度和可信度,保障安全与伦理合规。
人工智能大模型 智能体高质量数据集通用要求
主要内容:本标准规范人工智能大模型智能体高质量数据集的数据内容与分类(任务场景与复杂度分类)、数据标准规范(交互轨迹、意图、参数、状态)、质量指标体系(相关性、准确性、复杂性、多样性、一致性等)、基准数据集构建(构建方法、评估任务、元数据描述)等内容。
拟解决问题:解决传统数据集无法有效训练具备规划和执行力智能体的问题;解决标注规则不同意导致数据质量低、评估结果不可比的问题;为智能体研发和评测提供高质量、标准化、场景化数据支撑。
项目计划
团体标准制定流程需经过“五稿”(工作组讨论稿、征求意见稿、技术审查稿、报批稿、发布稿)、“两会”(征求意见会、技术审查会),整个周期一般控制在8-12个月。
根据标委会安排,“人工智能大模型 智能体”系列标准预计2025年12月立项,计划5月份召开启动会暨首次研讨会,7月召开征求意见会,9-10月在全国团体标准信息平台公开意见征集,11月召开技术审查会,12月发布。
诚邀标准共建
本系列项目由信创云联(北京)智能技术研究有限公司(简称“信创云联”)负责组织发布,致力于以国家战略为指引,以服务行业为根本,充分发挥标准的桥梁纽带作用,推动科技成果落地生根、助力产业经验转化为行业方案,凝聚产业共识合力,引领产业全链条协同创新,推进行业高质量发展。
为进一步扩大标准编制与宣贯工作的参与范围,提升标准的创新性、实用性及行业影响力,现诚邀人工智能与智能体领域的企事业单位、高校院所、检测认证机构等相关单位一起参与“人工智能大模型 智能体”系列标准建设。
标委会工作
在研标准
11月30日截止征集!《企业数据资产》系列标准欢迎数据产业相关单位加入
中国船级社牵头智能船舶领域标准制定 护航船舶工业高质量发展!
已发布标准

