清华大学《DeepSeek与AI幻觉》手把手教你规范性提问规避AI一本正经的胡说八道

Dr.X的基因空间

2025-02-21

预防AI幻觉——清华大学DeepSeek高端教程手把手教你

AI幻觉（AI Hallucination）是指人工智能系统生成的输出看似合理，但实际上不符合事实、逻辑或现实的情况。这种现象常见于大语言模型（LLM）、图像生成模型等AI系统，主要表现为：

1. 典型表现

虚构事实
：生成不存在的数据、事件或引用
逻辑错误
：构建看似合理但实际矛盾的论述
过度泛化
：从有限信息得出不准确的普遍结论
语境误解
：错误关联不相关的概念

2. 技术成因

数据偏差
：训练数据中的噪声或错误被放大
概率驱动
：模型优先选择统计上合理而非事实正确的输出
知识边界
：超出训练数据覆盖范围时的"猜测"行为
提示诱导
：问题表述本身隐含错误假设

3. 典型案例

医疗AI建议使用未经验证的疗法
法律文书生成时引用虚构判例
历史问答中出现时间线错乱
代码生成时使用报错或不存在的API接口

清华大学《DeepSeek与AI幻觉》技术白皮书（第五版）

为了防止普通用户在使用AI人工智能助手时因碰见AI幻觉而难以辨析AI的输出是否可靠而苦恼时，清华大学新闻与传播学院新媒体研究中心 × 人工智能学院联合课题组发布了相关技术白皮书《DeepSeek与AI幻觉》

研究背景

基于对1327例AI误用事件的跟踪分析，本白皮书首次提出“AI幻觉双效应理论”——当生成式AI突破其知识边界时，既可能引发决策风险（负向幻觉），也可能产生创新突破（正向幻觉）。

核心发现

1. AI幻觉的二元分类体系

类别	特征	典型案例
事实性幻觉	输出与客观现实矛盾	建议糖尿病患者使用蜂蜜控糖
忠实性幻觉	输出偏离用户原始意图	将"蜂蜜代糖可行性"转化为蜂蜜营销

2. 技术成因三维模型

数据缺陷
：训练语料时效性偏差（如引用2005年前医学指南）
推理超限
：概率模型过度外推（如虚构《水浒传》情节）
置信度错位
：校准曲线显示，AI对错误答案的置信度普遍高于人类30%

3. 跨场景压力测试

在300道常识题验证中：

模型版本	错误率	典型错误案例
DeepSeek v3.2	29.7%	民族音乐分类错误（藏族↔佤族）
DeepSeek-R1	22.1%	虚构"宋江五台山遇险"完整叙事链
+联网验证模块	17.3%	历史事件时间线误差（±5年内）

4. 风险防控技术方案

graph LR
    A[用户提问] --> B{是否包含专业术语?}
    B -->|是| C[激活知识图谱验证]
    B -->|否| D[基础语义分析]
    C --> E[比对NMPA/药典等权威库]
    D --> F[生成初始答案]
    E --> G[置信度标注]
    F --> G
    G --> H{置信度<80%?}
    H -->|是| I[触发双模型交叉验证]
    H -->|否| J[输出最终答案]