大数跨境

可信AI|中国信通院“生成式人工智能模型应用幻觉评估”首批评测正式启动

可信AI|中国信通院“生成式人工智能模型应用幻觉评估”首批评测正式启动 CAICT人工智能
2026-04-22
10

近年来,生成式人工智能技术加速演进,相关模型应用已广泛渗透至办公协同、内容创作、智能问答、行业服务等多类场景。随着应用规模持续扩大,模型在事实准确性、来源忠实性、上下文一致性、指令遵循和复杂推理等方面的偏差,可能进一步引发错误信息传播、业务判断失准、用户误导、行业应用风险外溢等问题。

目前,中国信息通信研究院依托中国人工智能产业发展联盟(AIIA)安全治理委员会,联合多家单位完成《生成式人工智能模型应用幻觉评估框架》编制工作。现正式启动“生成式人工智能模型应用幻觉评估”评测工作,诚邀各相关单位积极报名参与。


评测维度


本评测以《生成式人工智能模型应用幻觉评估框架》为依据,构建覆盖事实准确性、来源忠实性、内部一致性、指令遵循能力、逻辑推理能力、不确定性的诚实表达与处理能力等核心维度的评估体系。评测过程中,综合参评产品的功能特征与实际应用场景,制定针对性的评估方案,结合技术测试、材料审查和专家评审等方式,对模型应用的幻觉水平进行评估。



评测流程


从即日起开启专项评测报名,拟于2026年8月完成本批次全部评测工作,欢迎有意向的企业、机构报名参评。



咨询联系人


马老师  15210139366(同微信)

陈老师  18500022046(同微信)


【声明】内容源于网络
0
0
CAICT人工智能
中国信通院人工智能研究所官方公众号。关注我们,了解中国信通院人工智能工作动态,了解人工智能技术研究、标准制定、评估测试、行业应用、产业发展、监管政策及国际交流等前沿进展。
内容 198
粉丝 1
CAICT人工智能 中国信通院人工智能研究所官方公众号。关注我们,了解中国信通院人工智能工作动态,了解人工智能技术研究、标准制定、评估测试、行业应用、产业发展、监管政策及国际交流等前沿进展。
总阅读7.0k
粉丝1
内容198