近年来,生成式人工智能技术加速演进,相关模型应用已广泛渗透至办公协同、内容创作、智能问答、行业服务等多类场景。随着应用规模持续扩大,模型在事实准确性、来源忠实性、上下文一致性、指令遵循和复杂推理等方面的偏差,可能进一步引发错误信息传播、业务判断失准、用户误导、行业应用风险外溢等问题。
目前,中国信息通信研究院依托中国人工智能产业发展联盟(AIIA)安全治理委员会,联合多家单位完成《生成式人工智能模型应用幻觉评估框架》编制工作。现正式启动“生成式人工智能模型应用幻觉评估”评测工作,诚邀各相关单位积极报名参与。
评测维度
本评测以《生成式人工智能模型应用幻觉评估框架》为依据,构建覆盖事实准确性、来源忠实性、内部一致性、指令遵循能力、逻辑推理能力、不确定性的诚实表达与处理能力等核心维度的评估体系。评测过程中,综合参评产品的功能特征与实际应用场景,制定针对性的评估方案,结合技术测试、材料审查和专家评审等方式,对模型应用的幻觉水平进行评估。
评测流程
从即日起开启专项评测报名,拟于2026年8月完成本批次全部评测工作,欢迎有意向的企业、机构报名参评。

咨询联系人
马老师 15210139366(同微信)
陈老师 18500022046(同微信)

