大数跨境

RAG搜对了却答错?德国萨尔大学找到了真相丨ACL'26

RAG搜对了却答错?德国萨尔大学找到了真相丨ACL'26 量子位
2026-04-17
3
导读:长文档、矛盾信息统统捋清
作者:Disco-RAG团队 | 来源:量子位

RAG(检索增强生成)已成为大模型落地的核心技术,但实际应用中存在明显痛点:即便检索到正确文档,模型输出答案仍可能严重偏离。

德国萨尔大学、腾讯优图、上海交大、复旦大学和浙江大学联合团队指出:问题核心在于阅读理解环节而非检索过程。传统RAG将段落简单拼接,抹平了内部主次关系和跨段落逻辑脉络,导致模型接收的是一锅“信息乱炖”。

为此,团队提出Disco-RAG——在检索与生成间引入“读懂”环节的新型框架。该成果已被ACL 2026主会录用为长文,在三大基准测试中实现全程零训练的性能突破。

传统RAG的典型错误案例

当用户询问“补充维生素D能预防流感吗?”,系统检索到两段关键文献:

段落A:“冬季维生素D偏低人群中,补充后流感发病率下降12%。”

段落B:“大规模试验未发现维生素D与流感风险存在显著关联。”

传统RAG直接拼接两段文本,模型仅关注“下降12%”而忽略前置条件(冬季+特定人群),且无法识别段落间冲突,错误输出“维生素D有效”。

根本原因在于:

段落内部主次模糊——模型难以区分结论与前提条件;

段落之间逻辑断裂——无法识别支持、反驳或矛盾关系。

问题本质并非“搜不到”,而是“搜到却读不懂”。

现有补救方法的局限性

行业曾通过结果重排序、查询改写、内容压缩等方式优化检索环节,但均未触及核心:当多个段落存在复杂逻辑关系(如特定结论与普适实验冲突)时,仅调整输入内容顺序无法使模型理解关系本质。Disco-RAG聚焦于:让模型真正读懂现有内容,而非追求更优输入。

三步构建“读懂”能力

Disco-RAG通过修辞结构理论(RST)插入阅读理解环节,全程无需训练模型参数:

第一步:解析段落内部结构——将文本拆解为最小语义单元(EDU),标注核心内容与辅助说明(如区分“12%下降”为核心结论、“冬季偏低人群”为限定条件)。

第二步:构建跨段落关系网——通过两两分析预测支持、反驳等关系(如标记维生素D案例中A、B段落存在“对比”关系),形成逻辑有向图。

第三步:生成结构化提纲——综合问题、原文和关系网制定叙述策略(如优先说明研究背景差异,再协调矛盾结论),指导答案输出。

维生素D案例解析

在具体问题中:

- 论证树识别出段落A中“冬季特定人群”为限定条件,防止模型将局部结论泛化;

- 关系网明确A、B段落存在“对比”关系,避免简单采纳单方结论;

- 写作提纲规划分步回应:先阐释各研究适用范围,再分析矛盾原因,最终给出条件性结论。

输出从“有效/无效”的武断判断,升级为层次清晰、依据充分的分析,满足高质量回答需求。

三大权威基准全面领先

在零训练前提下,Disco-RAG使用开源模型通过多场景验证:

长文档推理(Loong):文档长度达25万tokens时,传统RAG几乎失效,Disco-RAG仍保持高准确率,性能甚至超越需专门训练的方法。

歧义问答(ASQA):在模糊问题处理中核心指标刷新记录,即使采用小参数模型也能媲美专用系统。

科学摘要(SciNews):在四项评测指标中三项排名第一,事实一致性位列第二,展现强大的跨文本整合能力。

性能提升的归因验证

消融实验证实结构化解析的核心价值:

三模块缺一不可——移除论证树、关系网或提纲任一环节均导致性能显著下滑;

结构化表示决定效果——仅添加通用规划步骤提升有限,关键在“论证树+关系网”的逻辑骨架构建;

抗噪能力突出——在检索结果掺入噪声或段落粒度变化时,系统保持稳定,传统方法波动剧烈。


灵活部署方案

结构分析与生成环节解耦,支持资源优化配置:

- 用Llama-3.1-8B(小模型)执行结构分析,Llama-3.3-70B(大模型)仅负责最终生成,即可恢复95%以上性能增益;

- 全流程采用8B模型运行Disco-RAG,效果仍远超70B模型的传统RAG实现。

结构分析模块支持“降配”部署,核心收益得以保留。

与模型训练的协同效应

在SciNews任务中验证:

- 零训练的Disco-RAG已超越微调的传统RAG系统;

- 结构化框架+微调实现叠加增益,证明两种方法路径互补。

应用策略明确:先部署Disco-RAG获取即时收益,再按需叠加微调进一步优化。

结论

Disco-RAG的核心突破在于:强化模型的篇章结构理解能力。

通过解析文本内部主次关系、建立跨段落逻辑脉络,并基于结构化提纲生成答案,系统在无需训练、不改变模型的前提下显著提升回答质量。尤其在长文档、高噪声场景优势突出,揭示出自然语言的逻辑骨架对信息理解的关键价值。

该框架不仅适用于RAG优化,也为多文档推理、长文本处理提供新思路。对于寻求高效落地的团队,Disco-RAG是轻量级的增强方案。

论文:Disco-RAG: Discourse-Aware Retrieval-Augmented Generation
链接:
https://arxiv.org/abs/2601.04377

【声明】内容源于网络
0
0
量子位
各类跨境出海行业相关资讯
内容 15042
粉丝 0
量子位 各类跨境出海行业相关资讯
总阅读182.6k
粉丝0
内容15.0k