可信AI｜中国信通院“生成式人工智能模型应用幻觉评估”首批评测正式启动- 大数跨境

CAICT人工智能

2026-04-22

近年来，生成式人工智能技术加速演进，相关模型应用已广泛渗透至办公协同、内容创作、智能问答、行业服务等多类场景。随着应用规模持续扩大，模型在事实准确性、来源忠实性、上下文一致性、指令遵循和复杂推理等方面的偏差，可能进一步引发错误信息传播、业务判断失准、用户误导、行业应用风险外溢等问题。

目前，中国信息通信研究院依托中国人工智能产业发展联盟（AIIA）安全治理委员会，联合多家单位完成《生成式人工智能模型应用幻觉评估框架》编制工作。现正式启动“生成式人工智能模型应用幻觉评估”评测工作，诚邀各相关单位积极报名参与。

评测维度

本评测以《生成式人工智能模型应用幻觉评估框架》为依据，构建覆盖事实准确性、来源忠实性、内部一致性、指令遵循能力、逻辑推理能力、不确定性的诚实表达与处理能力等核心维度的评估体系。评测过程中，综合参评产品的功能特征与实际应用场景，制定针对性的评估方案，结合技术测试、材料审查和专家评审等方式，对模型应用的幻觉水平进行评估。