当前,多模态大模型加速向全模态演进,实现文本、图像、视频、音频、3D等多源异构数据深度融合与统一表征,其理解、生成、推理、交互能力持续提升,从内容创作、智能交互快速渗透至工业、教育、医疗、自动驾驶、影视游戏等领域,有望成为AI赋能千行百业的关键基础设施。
中国信息通信研究院(中国信通院)人工智能研究所始终锚定多模态大模型前沿技术趋势与产业落地痛点,依托中国人工智能产业发展联盟及人工智能关键技术和应用评测工业和信息化部重点实验室,联合业界相关机构,发布了《多模态大模型技术要求和评估方法》标准。为进一步提升多模态大模型应用能力,加速人工智能应用落地,中国信通院人工智能研究所正式启动2026年首批“可信AI”多模态大模型评估工作,评估范围包括:
多模态大模型通用能力评估,重点评估多模态表征、融合、转换、对齐等基础能力;
多模态大模型专项能力评估,涵盖视觉语言模型 (VLMs)、视频生成大模型、图像生成大模型、语音大模型、空间多模态大模型、原生多模态大模型等;
全模态大模型(OMMs)评估,聚焦全模态理解与生成一体化、全模态交互能力等核心能力;
行业多模态大模型评估,包括金融、政务、教育、汽车等行业多模态大模型。
中国信通院人工智能研究所多模态大模型相关标准的推进与评估工作正有序开展,欢迎相关企业咨询。中国信通院人工智能研究所将持续关注多模态大模型领域发展,长期开展相关产品能力评估和标准化工作,定期发布评估结果,欢迎各企业专家老师与我们联系。
联系人
齐格格 18820191106
qigege@caict.ac.cn
张丹 19852822678
zhangdan3@caict.ac.cn

