大数跨境
0
0

清华大学《DeepSeek与AI幻觉》手把手教你规范性提问规避AI一本正经的胡说八道

清华大学《DeepSeek与AI幻觉》手把手教你规范性提问规避AI一本正经的胡说八道 Dr.X的基因空间
2025-02-21
1

预防AI幻觉——清华大学DeepSeek高端教程手把手教你

AI幻觉(AI Hallucination)是指人工智能系统生成的输出看似合理,但实际上不符合事实、逻辑或现实的情况。这种现象常见于大语言模型(LLM)、图像生成模型等AI系统,主要表现为:

1. 典型表现

  • 虚构事实
    :生成不存在的数据、事件或引用
  • 逻辑错误
    :构建看似合理但实际矛盾的论述
  • 过度泛化
    :从有限信息得出不准确的普遍结论
  • 语境误解
    :错误关联不相关的概念

2. 技术成因

  • 数据偏差
    :训练数据中的噪声或错误被放大
  • 概率驱动
    :模型优先选择统计上合理而非事实正确的输出
  • 知识边界
    :超出训练数据覆盖范围时的"猜测"行为
  • 提示诱导
    :问题表述本身隐含错误假设

3. 典型案例

  • 医疗AI建议使用未经验证的疗法
  • 法律文书生成时引用虚构判例
  • 历史问答中出现时间线错乱
  • 代码生成时使用报错或不存在的API接口

清华大学《DeepSeek与AI幻觉》技术白皮书(第五版)

为了防止普通用户在使用AI人工智能助手时因碰见AI幻觉而难以辨析AI的输出是否可靠而苦恼时,清华大学新闻与传播学院新媒体研究中心 × 人工智能学院联合课题组发布了相关技术白皮书《DeepSeek与AI幻觉》


研究背景

基于对1327例AI误用事件的跟踪分析,本白皮书首次提出“AI幻觉双效应理论”——当生成式AI突破其知识边界时,既可能引发决策风险(负向幻觉),也可能产生创新突破(正向幻觉)。


核心发现

1. AI幻觉的二元分类体系

类别
特征
典型案例
事实性幻觉
输出与客观现实矛盾
建议糖尿病患者使用蜂蜜控糖
忠实性幻觉
输出偏离用户原始意图
将"蜂蜜代糖可行性"转化为蜂蜜营销

2. 技术成因三维模型

  • 数据缺陷
    :训练语料时效性偏差(如引用2005年前医学指南)
  • 推理超限
    :概率模型过度外推(如虚构《水浒传》情节)
  • 置信度错位
    :校准曲线显示,AI对错误答案的置信度普遍高于人类30%

3. 跨场景压力测试

在300道常识题验证中:

模型版本
错误率
典型错误案例
DeepSeek v3.2
29.7%
民族音乐分类错误(藏族↔佤族)
DeepSeek-R1
22.1%
虚构"宋江五台山遇险"完整叙事链
+联网验证模块
17.3%
历史事件时间线误差(±5年内)

4. 风险防控技术方案

graph LR
    A[用户提问] --> B{是否包含专业术语?}
    B -->|是| C[激活知识图谱验证]
    B -->|否| D[基础语义分析]
    C --> E[比对NMPA/药典等权威库]
    D --> F[生成初始答案]
    E --> G[置信度标注]
    F --> G
    G --> H{置信度<80%?}
    H -->|是| I[触发双模型交叉验证]
    H -->|否| J[输出最终答案]

5. 正向幻觉开发路径

  • 蛋白质设计
    :利用错误折叠模式发现新型酶结构(2021年诺贝尔化学奖案例)
  • 自动驾驶
    :通过异常路径推演提升极端天气识别率17.2%
  • 艺术创作
    :生成对抗网络(GAN)产生超现实视觉概念

行业应用指南

  1. 金融领域
      
  • 启用实时监管数据库联动(接入央行征信系统)  
  • 对投资建议自动添加风险等级标签  
  1. 医疗场景
      
  • 强制对话记录追踪(符合《电子病历管理规范》)  
  • 诊断建议需关联最新临床指南版本号  
  1. 教育领域
      
  • 历史类答案自动加载文献DOI溯源  
  • 数学推导过程可视化校验  

清华大学《DeepSeek与AI幻觉》技术白皮书部分内容概览

获取方式  
关注公众号 → 回复「AI防幻」获取完整版白皮书(含可执行代码模块)


【声明】内容源于网络
0
0
Dr.X的基因空间
【中国科学院博士】10年生命科学数据挖掘研究经验,关注生物医药领域体外诊断(IVD)方向,如肿瘤早筛、传染病未知病原快速检测中的技术创新及其与人工智能(AI)的赋能应用
内容 176
粉丝 0
Dr.X的基因空间 【中国科学院博士】10年生命科学数据挖掘研究经验,关注生物医药领域体外诊断(IVD)方向,如肿瘤早筛、传染病未知病原快速检测中的技术创新及其与人工智能(AI)的赋能应用
总阅读140
粉丝0
内容176