中国信通院联合高等教育出版社开展教育领域高质量数据集和模型基准标准能力建设- 大数跨境

CAICT人工智能

2026-03-30

为深入贯彻落实《教育强国建设规划纲要（2024—2035）》精神，推动教育数字化转型与人工智能技术深度融合，中国信息通信研究院（以下简称“中国信通院”）与高等教育出版社有限公司（以下简称“高教社”）携手开展教育领域高质量数据集和模型基准标准能力建设，围绕教育领域人工智能技术规范建设深耕细作，目前已形成三套系统化、可落地的教育人工智能数据技术规范体系，为教育人工智能生态建设及教育智能化改革高质量发展筑牢标准根基。

核心成果一：《面向教育教学行业的人工智能数据集建设与质量评估方法》

该标准立足教育教学行业人工智能应用需求，围绕数据集建设与质量评估全流程，按照知识层次、数据模态、使用阶段及数据安全等维度，系统构建数据需求分析、数据规划、数据采集、数据标注、数据合成、数据处理、数据质检、数据反馈等八大能力域，形成贯穿数据全生命周期的能力框架。同时，明确数据集质量评估的关键流程，包括评估准备、参数初始化、自动化评估执行、人工校核以及评估总结与分析等环节，建立“自动化+人工”相结合的评估方法体系，为教育行业数据拥有单位、大模型及场景应用开发单位提供清晰的高质量数据集建设与评估指引。该标准有效解决当前教育数据格式不统一、质量参差不齐、标注规范缺失等行业痛点，推动教育数据采集加工向标准化、智能化、规范化升级。

核心成果二：《面向人工智能的教育教学行业数据采集和加工处理能力要求》

该标准有效解决当前教育数据格式不统一、质量参差不齐、标注规范缺失等行业痛点。标准构建了数据采集、标注、合成、处理、存储、质检、管理7大能力域，明确了技术能力、规范水平、人员管理、数据安全等6大能力要素，创新建立1-5级能力评估体系，为教育行业数据拥有、大模型及场景应用开发等不同主体机构提供清晰的能力建设指引，推动教育数据采集加工向标准化、智能化、规范化升级，为人工智能在教育领域的高质量应用筑牢了数据底座。

核心成果三：《面向教育教学行业的大模型基准测试指标与方法》

该标准紧扣教育教学实际场景需求，破解当前行业面向教育场景的大模型评测体系不完善、产业评测适配性不足等难题。标准构建起基础能力、专业能力、任务能力、安全能力四大维度的基准测试指标体系，同时明确评测数据构建、基准测试执行、结果评估等全流程方法。该标准不仅为教育大模型研发方提供自评、迭代优化、合规验证的科学依据，也为教育行业应用方提供模型选型、验收的专业指引，推动教育大模型向高质量、场景化、安全化发展。

项目研究过程中，团队完成了超全维度的教育教学行业调研，覆盖中职、高职、本科、研究生全学段超 2000 个专业，囊括视频、音频、试题、虚仿实验、电子书等多模态数据，标注粒度细化至 “专业+课程+知识模块+能力目标”，形成详实的行业调研数据支撑文件，精准把握行业发展痛点与需求。当前，我国 AI + 教育市场规模持续增长，教育大模型对高质量数据集与标准化评测体系的需求日益迫切，此次三项技术规范的研制，正是对行业发展需求的精准回应，也是推动教育数字化转型的关键举措。

中国信通院、高教社联合行业专家开展教育领域标准研讨

作为人工智能领域标准研制的核心机构与教育出版领域的龙头单位，中国信通院与高教社的深度合作，是跨领域协同推进教育数字化标准建设的典范。未来，双方将继续依托战略合作框架，持续完善教育人工智能领域技术标准体系，推动标准的落地推广与产业应用，充分发挥标准的规范引领作用，提升教育行业人工智能数据处理与大模型应用能力，以标准赋能教育智能化改革，为加快建设教育强国、办好人民满意的教育注入新动能。

业务联系人

郭老师 13488846037（微信同）

【声明】内容源于网络

CAICT人工智能

中国信通院人工智能研究所官方公众号。关注我们，了解中国信通院人工智能工作动态，了解人工智能技术研究、标准制定、评估测试、行业应用、产业发展、监管政策及国际交流等前沿进展。

内容 150

粉丝 1

CAICT人工智能中国信通院人工智能研究所官方公众号。关注我们，了解中国信通院人工智能工作动态，了解人工智能技术研究、标准制定、评估测试、行业应用、产业发展、监管政策及国际交流等前沿进展。

总阅读3.7k

粉丝1

内容150