大数跨境
0
0

中铁十四局通过中国信通院“可信AI”大语言模型专项评估

中铁十四局通过中国信通院“可信AI”大语言模型专项评估 CAICT人工智能
2026-01-09
4




近年来,大模型参数规模和模型性能不断创出新高,加速推进人工智能实用化、通用化和普惠化发展,正逐步赋能金融、教育、服务、制造等多个行业,成为驱动产业升级、促进创新的关键引擎。然而,当前大模型产品类型繁多,应用效能水准参差不齐,亟需通过技术规范制定、评估测试等手段为技术创新发展提供指引。


中国信息通信研究院(以下简称“中国信通院”)人工智能研究所高度关注基础大模型发展态势,依托人工智能关键技术和应用评测工业和信息化部重点实验室大模型工作组和中国人工智能产业发展联盟开展《大规模预训练模型技术和应用评估方法》系列技术规范研制工作,关注基础大模型从开发到应用的全生命周期。同时,依据该系列技术规范体系形成系统性评估方法,并开展多轮评估工作。


2025年12月,中铁十四局集团有限公司(以下简称“中铁十四局”)参与中国信通院组织的“可信AI”大模型评估,其产品深远大模型顺利通过大语言模型专项评估并最终获得4+级评级。此次评估,依据《大规模预训练模型技术和应用评估方法 第 2 部分:模型能力》开展,涵盖能力支持度、服务成熟度等16个能力项。在能力支持度方面,参测产品在任务覆盖度、文本内容完备度、语种丰富度等维度表现突出,且在语义消歧、对话系统、文本生成、代码生成、文本内容推荐等能力项上具备较高的性能效果。在服务成熟度方面,参测产品在服务稳定性、开放程度、服务并发性等方面表现优异,展现了其在复杂环境中持续提供可靠、高效服务的能力。


【中铁十四局深远大模型介绍】

(以下介绍信息由中铁十四局集团有限公司提供)


深远大模型是一款创新的大语言模型,旨在为用户提供文本能力服务。借助AI技术和训练数据,深远大模型能够理解用户输入并生成准确、连贯的内容。作为深远大模型的核心特点之一,其自然语言处理能力使得它能够理解并适应各种语境和话题。针对文章撰写、翻译,还是内容提取等自然语言任务,深远大模型都能根据输入的指示产生与之相符的内容,满足客户需求。


深远大模型注重用户体验,提供直观且易于使用的界面。通过简洁的设计和清晰的操作流程,用户可以轻松输入问题或指令,并迅速获取到所需的结果。深远大模型还配备了智能建议功能,能够预测用户可能的意图,并给出相关的选项,以便更好地满足用户需求。安全性是深远大模型的另一个重要特点,用户的隐私和数据安全始终是首要任务,大模型采取了多种安全防护措施,确保用户信息得到妥善保护,不会被泄露或滥用。此外,深远大模型也可为企业提供可靠的文本生成解决方案。无论是需要自动生成文章、撰写广告宣传语还是进行市场分析,深远大模型都能通过智能生成算法和自然语言处理技术为客户提供定制化的服务。


图 1  中铁十四局深远大模型产品界面


图 2  中铁十四局深远大模型产品界面


【评估介绍】


为进一步促进大模型技术更新迭代,引导大模型技术应用落地,中国信通院将持续开展大模型技术能力评估工作,面向语言大模型、视觉大模型、语音大模型、多模态大模型开展专项评估,具体如下:


1

语言大模型

评估语言大模型在词法分析、句法分析、语义消歧、机器翻译、对话系统、情感分析、文本分类、文本生成、代码生成、知识图谱、文本内容推荐等任务上的效果。

2

视觉大模型

评估视觉大模型在OCR、人脸识别、物体识别、动作识别、图片生成、图片内容推荐、目标检测、语义分割、实例分割、视觉检索等任务上的效果。

3

语音大模型

评估语音大模型在语音唤醒、语音识别、语音合成、声纹识别、会议记录自动识别等任务上的效果。

4

多模态大模型

评估多模态大模型在图文检索、图文生成、图文检索、视频文本相关性匹配等任务上的效果。


图 3  评估通过企业清单


联系人

陶老师,18951766189

taoqiuyu@caict.ac.cn


周老师,13773372013

zhoujing3@caict.ac.cn


张老师,19852822678

zhangdan3@caict.ac.cn


【声明】内容源于网络
0
0
CAICT人工智能
中国信通院人工智能研究所官方公众号。关注我们,了解中国信通院人工智能工作动态,了解人工智能技术研究、标准制定、评估测试、行业应用、产业发展、监管政策及国际交流等前沿进展。
内容 26
粉丝 0
CAICT人工智能 中国信通院人工智能研究所官方公众号。关注我们,了解中国信通院人工智能工作动态,了解人工智能技术研究、标准制定、评估测试、行业应用、产业发展、监管政策及国际交流等前沿进展。
总阅读356
粉丝0
内容26