大数跨境
0
0

AprèsCoT:利用知识图谱和思维链解释大模型的答案

AprèsCoT:利用知识图谱和思维链解释大模型的答案 知识图谱科技
2025-10-09
6
导读:ApresCoT背后的理念是将答案以及通过思维链CoT提示获得的LLMs推理步骤映射到知识图谱上,以生成结构化解释。会议参与者将从多个LLMs和知识图谱中选择,探索ApresCoT的可视化推理路径、识
摘要
我们展示了ApresCoT,这是一种事后工具,用于理解大型语言模型(LLMs)如何回答问题。ApresCoT背后的理念是将答案以及通过思维链(CoT)提示获得的LLMs推理步骤映射到知识图谱上,以生成结构化解释。会议参与者将从多个LLMs和知识图谱中选择,探索ApresCoT的可视化推理路径、识别潜在错误答案以及发现知识图谱质量问题。

核心速览

研究背景

  1. 研究问题:这篇文章要解决的问题是如何解释大型语言模型(LLMs)的回答。具体来说,LLMs在生成回答时可能会产生幻觉,生成自信但不准确的输出,这在高风险领域如医疗和教育中限制了它们的应用。
  2. 研究难点:该问题的研究难点包括:如何追踪LLMs生成的答案的来源,以及如何将LLMs的推理步骤映射到知识图谱(KG)中以生成结构化的解释。
  3. 相关工作:现有的解决方案如Perplexity和Microsoft Copilot采用了检索增强生成(RAG)方法,即从互联网上检索相关文档,将其总结并添加到LLMs的上下文中,以辅助生成答案。然而,RAG并不能保证LLMs在其生成过程中使用检索到的信息。

研究方法

这篇论文提出了AprèsCoT,用于解决LLMs回答解释的问题。具体来说,
  1. CoT提示:首先,利用链式思维(CoT)提示,LLMs可以生成其推理步骤。例如,通过在查询后附加“让我们一步一步地思考”来生成推理步骤。
  2. 知识图谱映射:其次,如果推理步骤是合理的,可以将这些步骤映射到存储在知识图谱中的事实,以生成数据来源线索,从而形成结构化解释。
  3. 对齐机制:为了将对齐CoT和LLMs的答案与知识图谱中的节点和边,使用了预训练的文本文档嵌入模型。具体步骤如下:
    • 将知识图谱元素转换为文本。
    • 使用预训练的文本嵌入模型计算CoT提示生成的句子与知识图谱中存储的事实之间的余弦相似度。
    • 选择相似度阈值为0.7,通过网格搜索在验证数据集上确定。

实验设计

  1. 数据收集:当前版本的AprèsCoT预装了ChatGPT 3.5和GPT-4o-Mini的API访问权限,以及电影和医疗的知识图谱。
  2. 实验设计:实验设计包括三个用例:
    • 一致性答案和CoT:用户询问关于Jean Rochefort电影的发布年份,LLMs生成两个答案(1972和1990),并且可以通过CoT追踪到这两个答案的推理路径。
  • 知识图谱数据质量:用户询问相同的问题,但使用没有上下文知识的GPT-4o-Mini模型,观察生成的答案和推理步骤,识别知识图谱的不完整性。
  • 不一致的答案和CoT:用户询问关于真菌引起的功能障碍影响哪些动物的问题,LLMs生成三个答案,但只有部分答案与推理路径一致,展示了LLMs之间的推理差异。

结果与分析

  1. 一致性答案和CoT:在一致性答案和CoT的用例中,LLMs生成的答案与知识图谱中的事实一致,可以通过CoT追踪到推理路径。
  2. 知识图谱数据质量:在知识图谱数据质量的用例中,GPT-4o-Mini模型生成的部分答案与知识图谱中的事实一致,但其他答案可能是由于知识图谱不完整或模型幻觉导致的。
  3. 不一致的答案和CoT:在不一致的答案和CoT的用例中,LLMs生成的部分答案与推理路径一致,但存在推理间隙,展示了LLMs之间的推理差异。

总体结论

这篇论文提出了AprèsCoT,一种轻量级的工具,用于理解LLMs的回答。通过利用链式思维提示和知识图谱,AprèsCoT能够生成结构化的解释,帮助用户验证LLMs的回答,识别知识图谱的不完整性,并比较不同LLMs的性能。该工具在电影和医疗领域的知识图谱上进行了演示,展示了其在解释LLMs回答方面的潜力。

论文评价

优点与创新

  1. 新颖的LLM解释方法:ApresCoT是第一个利用CoT提示和知识图谱(KG)来理解LLM答案的工具。其思想与最近邻LLMs相似,但通过将CoT可视化到KG上的结构化推理路径,展示了其创新性。
  2. 对齐机制:ApresCoT的主要技术挑战是将CoT和LLM的答案与相应KG中的节点和边对齐。通过将KG元素转换为文本并使用预训练的文本嵌入模型匹配CoT提示生成的句子,解决了这一挑战。
  3. 应用案例:在MetaQA电影KG和统一医学语言系统(UMLS)KG上展示了ApresCoT的应用,证明了其在LLM答案验证、KG完整性分析和LLMs性能比较中的价值。
  4. 轻量级工具:ApresCoT是一个轻量级的后处理工具,仅依赖于对LLM的API访问,设计简单且易于使用。
  5. 支持RAG模式:ApresCoT支持检索增强生成(RAG)模式,允许用户比较具有和不具有RAG的LLMs的问题回答性能。

不足与反思

  1. 下一步工作:在ApresCoT的下一个版本中,将探索使用树状思维和图状思维提示的LLM解释。此外,承认CoT提示可能会影响LLM的推理过程,可能导致与简单提示不同的答案。

关键问题及回答

问题1:AprèsCoT工具是如何实现对LLMs答案的结构化解释的?
AprèsCoT工具通过对链式思维(CoT)提示和知识图谱(KG)的结合来实现对LLMs答案的结构化解释。具体步骤如下:
  1. CoT提示:首先,利用CoT提示,LLMs可以生成其推理步骤。例如,通过在查询后附加“让我们一步一步地思考”来生成推理步骤。
  2. 知识图谱映射:其次,如果推理步骤是合理的,可以将这些步骤映射到存储在知识图谱中的事实,以生成数据来源线索,从而形成结构化解释。
  3. 对齐机制:为了将对齐CoT和LLMs的答案与知识图谱中的节点和边,使用了预训练的文本文档嵌入模型。具体步骤如下:
    • 将知识图谱元素转换为文本。
    • 使用预训练的文本嵌入模型计算CoT提示生成的句子与知识图谱中存储的事实之间的余弦相似度。
    • 选择相似度阈值为0.7,通过网格搜索在验证数据集上确定。
通过这些步骤,AprèsCoT能够生成结构化的解释,帮助用户验证LLMs的回答,识别知识图谱的不完整性,并比较不同LLMs的性能。
问题2:在实验设计中,AprèsCoT工具是如何利用知识图谱来验证LLMs生成的答案的?
  1. 数据收集:当前版本的AprèsCoT预装了ChatGPT 3.5和GPT-4o-Mini的API访问权限,以及电影和医疗的知识图谱。
  2. 实验设计:实验设计包括三个用例:
    • 一致性答案和CoT:用户询问关于Jean Rochefort电影的发布年份,LLMs生成两个答案(1972和1990),并且可以通过CoT追踪到这两个答案的推理路径。
    • 知识图谱数据质量:用户询问相同的问题,但使用没有上下文知识的GPT-4o-Mini模型,观察生成的答案和推理步骤,识别知识图谱的不完整性。
    • 不一致的答案和CoT:用户询问关于真菌引起的功能障碍影响哪些动物的问题,LLMs生成三个答案,但只有部分答案与推理路径一致,展示了LLMs之间的推理差异。
通过这些用例,AprèsCoT能够验证LLMs生成的答案是否与知识图谱中的事实一致,并识别出可能的知识图谱不完整性或模型幻觉问题。
问题3:AprèsCoT工具在处理LLMs答案时,如何处理推理步骤与知识图谱的对齐问题?
  1. 输入处理:首先,将知识图谱元素转换为文本,并使用预训练的文本嵌入模型(如all-MiniLM)计算CoT提示生成的句子与知识图谱中存储的事实之间的余弦相似度。
  2. 匹配机制:选择相似度阈值为0.7,通过网格搜索在验证数据集上确定。具体步骤如下:
    • 计算潜在匹配的余弦相似度。
    • 选择相似度高于阈值的匹配作为最佳匹配。
    • 如果没有匹配,则返回无匹配结果。
  3. 输出展示:最后,将匹配的推理步骤在知识图谱上进行可视化,生成结构化的解释,帮助用户理解LLMs的推理过程。
通过这种对齐机制,AprèsCoT能够有效地将LLMs的推理步骤与知识图谱中的事实对应起来,生成结构化的解释,从而帮助用户验证LLMs的回答,识别知识图谱的不完整性,并比较不同LLMs的性能。


欢迎加入「知识图谱增强大模型产学研」知识星球,获取最新产学研相关"知识图谱+大模型"相关论文、政府企业落地案例、避坑指南、电子书、文章等,行业重点是医疗护理、医药大健康、工业能源制造领域,也会跟踪AI4S科学研究相关内容,以及Palantir、OpenAI、微软、Writer、Glean、OpenEvidence等相关公司进展。


电子书推荐


[300页电子书]Palantir 股票的大数据,大利润:为什么Palantir是未来企业级AI的潜力股

[555页电子书]从LLM Agent到RAG与知识图谱全攻略实战指南重磅发布——构建具备推理、检索与行动能力的智能体

250页电子书-医学领域的人工智能革命:GPT-4及医学大模型未来展望。OpenAI CEO作序

[100页电子书]知识图谱&大模型双轮驱动的工业 AI 数智化转型权威指南 - Cognite

[73页]OpenAI联合哈佛等重磅发布全球首份ChatGPT使用报告,分析用户增长、使用模式及其经济价值

[140页]Neo4j GraphRAG白皮书

[72页]谷歌推出个性化实时监测主动健康管理大模型PH-LLM

[180页电子书]GraphRAG全面解析及实践-Neo4j:构建准确、可解释、具有上下文意识的生成式人工智能应用

[30页电子书]GraphRAG开发者指南

往期推荐


亚马逊云科技与柯基数据联合打造的“Automotive Services GraphRAG”解决方案亮相慕尼黑IAA展会!

GraphRAG实施中常见挑战的分析及其应对策略-海外图谱增强大模型公司Lettria的GraphRAG实践建议

知识图谱与大模型的融合:SubGraphRAG在减少幻觉和提升准确性上的突破

海外大模型落地故事: Medisolv如何利用GraphRAG破解医疗报告难题 — Writer

图谱增强生成 GraphRAG :突破 GenAI 应用边界的利器

“GraphRAG+DeepSearch” 企业级多模态Agent知识平台V2.0 重磅升级!

利用 Amazon Bedrock 知识库构建 GraphRAG 应用的全面实战指南

理解与创新:RAG、Graph RAG以及Agentic RAG在AI中的应用

引领智能检索新纪元:Graph RAG vs RAG,谁才是真正的AI知识利器?

GraphRAG:连接数据世界的AI新引擎

GraphRAG性能飞跃:结合向量搜索与Agent路由,实现知识图谱复杂问题高效解答

突破AI知识边界:探索GraphRAG、向量RAG和Agentic RAG的融合之路

图谱增强大模型智能新纪元:RAG vs Graph RAG,"生成式+结构化+可解释+深度推理" 驱动的企业智能引擎

颠覆RAG的智能媒体检索利器:GraphRAG详解

用模糊解析强化LangChain的GraphRAG:自动构建知识图谱准确率提升3倍 — 基于BAML的实践笔记

构建高效的GraphRAG系统:简化架构与工具选择的艺术

FrOG:基于知识图谱的开源GraphRAG问答系统研究综述

工业大模型公司 Mivva 解锁能源AI见解:GraphRAG智能问答助手的实践旅程

MMGraphRAG:通过可解释的多模态知识图谱桥接视觉与语言模型

OpenAI重磅发布“KG+LLM”结合的企业智能知识管理红宝书,利用大模型构建时序知识图谱与新一代“GraphRAG”智能体

Timbr GraphRAG:结构化与非结构化数据,驱动更聪明的企业级GenAI

企业GenAI革命:海外大模型创业公司Writer解密GraphRAG和知识图谱如何引领智能知识服务未来

GraphRAG革命:如何利用知识图谱提升LLM的检索与生成能力

GraphRAG:用知识图谱与生成式AI开创关系感知的智能新时代

EraRAG:突破传统GraphRAG限制,实现动态语料库的高效检索增强生成

探索AI未来:GraphRAG——更高效智能的跨文档查询方式

知识增强大模型GraphRAG 如何彻底改变阿尔茨海默病的基因研究和治疗 - 美国Cedars-Sinai 医疗中心

GraphRAG + DeepSearch: 下一代企业级人机协同大模型推理架构及医药法律等领域Agent深度详解

GraphRAG:重新定义信息检索的智能革命

九大GraphRAG的全面评估:GraphRAG-Bench基准测试集解析 - 香港理工&腾讯优图等

什么时候GraphRAG超越传统RAG:突破医学等知识密集任务的AI新范式和GraphRAG-Bench评估框架

Precina Health 如何使用GraphRAG 通过实时洞察彻底改变 2 型糖尿病护理

Graph RAG框架、基本工具和实际用例

基于GraphRAG的妊娠期糖尿病管理本地大模型

OpenTCM:基于GraphRAG的传统中医药知识检索与诊断问答图谱增强大模型系统 - 香港中文大学

HyperGraphRAG:基于超图结构知识表示的新版GraphRAG - 北邮、安贞医院等

多模态GraphRAG初探:文档智能+知识图谱+大模型结合范式

如何构建医疗健康等复杂场景下的Agentic GraphRAG?

Agentic-RAG和GraphRAG双轮驱动,基于NCCN肿瘤医学指南开发用于个性化无幻觉乳腺癌治疗

GraphRAG最新成果:基于图的RAG统一框架深度分析 — 港中深&华为

Diffbot的GraphRAG大模型

医学知识图谱驱动的GraphRAG:Deepseek-R1与Weaviate用于高级Chatbot

利用GraphRAG和数字孪生进行个性化教育:面向工业4.0劳动力发展的虚拟现实、增量式学习和零样本情感分析- 亚利桑那大学等

用GraphRAG和知识图谱解锁GenAI大模型 - Neo4j CTO 演讲视频&PPT

普华永道GraphRAG-工具融合

释放多模态GraphRAG的力量:集成图像特征以获得更深入的洞察 - 2025最新PPT

PIKE-RAG: 微软开源下一代GraphRAG,知识增强大模型解锁企业级私有数据应用落地价值

[2025最新综述解读]定制化大模型的GraphRAG - 香港理工&吉林大学等

(88页)知识图谱增强大模型GraphRAG 2025年最新调研综述 - 密歇根大学、Adobe、Meta、亚马逊等

“大模型+知识图谱”双轮驱动的见解、技术和评估 - 英伟达的GraphRAG

GraphRAG和轻量级LightRAG技术及应用案例深度解析

故障分析怎么做?朴素KG方案及LLM+Graph RAG方案实现思路

GraphRAG 的演变 -Neo4j GenAI Graph Gathering 2.0

微软GraphRAG框架演进之路及带来的一些思考

LazyGraphRAG:微软重磅推出高性价比下一代GraphRAG

提升大型语言模型结果:何时使用GraphRAG

GraphRAG产业化应用落地挑战和探索:知易行难 - 企业大模型独角兽Glean实践之四

微软GraphRAG最新动态:通过动态社区选择改善全球搜索

现有RAG框架非完全总结:7个GraphRAG+17个传统RAG框架归纳

GraphRAG从研发到上线的挑战-硅谷企业级大模型知识库独角兽Glean系列之三

企业级知识库为什么要用GraphRAG - 硅谷企业级ChatGPT独角兽Glean系列之二

企业智能知识库企业Glean利用GraphRAG融资2.6亿美元

MedGraphRAG最新版:探索医学大模型领域的未来新革命 - 牛津&CMU

医学GraphRAG案例研究:将医生记录转换为医学时序知识图谱

微软GraphRAG 0.4.0&DRIFT图推理搜索更新

GraphRAG图检索增强,助力新一代大模型知识库的落地|爱分析活动

StructRAG: 下一代GraphRAG - 中科院&阿里

RAG前沿之RAG–知识图谱构建框架Graphusion:兼看LongRAG双视角检索增强生成范式

Structured-GraphRAG知识增强框架——足球游戏数据案例研究

解锁洞察:金融服务中的GraphRAG和标准RAG对比案例解析

蚂蚁图团队GraphRAG支持社区摘要——Token相比微软直降50%

从知识图谱到 GraphRAG:探索属性图的构建和复杂的数据检索实践

基于图谱和智能体的法律文档 GraphRAG案例深度解析 - WhyHow.AI

什么时候(不)用GraphRAG

GraphRAG工程落地成本详细解读和实例分析

企业生成式人工智能应用的架构模式:GraphRAG、RAG、DSFT和RAFT

知识图谱增强大模型GraphRAG全面综述解读 - 蚂蚁集团、北大、浙大、人大等

GraphRAG:使用知识图谱进行AI Agent编排和工业化路径

贝莱德&英伟达 - HybridRAG:整合GraphRAG和VectorRAG以实现金融信息高效提取

医学GraphRAG:通过知识图谱检索增强实现安全医疗大语言模型 - 牛津大学最新论文

GraphRAG类型、限制、案例、使用场景详细解析

GraphRAG在网络安全情报分析的变革性应用

GraphRAG + GPT-4o mini 低成本构建 AI 图谱知识库

GraphRAG案例讲解-由知识图谱驱动的辅助数据目录元数据发现大模型

GraphRAG有多贵?基于GPT-4o的Token令牌消耗成本分析

使用Streamlit、LangChain、Neo4j和GPT-4o构建GraphRAG实战讲解及开源实现

基于GraphRAG的SEO智能助手实战案例 - 解锁大模型和知识图谱结合的力量

[重磅]图数据库厂商Neo4j CTO详解GraphRAG:为生成式人工智能增添知识

引入GraphRAG的场景条件分析

重磅 - 微软官宣正式在GitHub开源GraphRAG

GraphRAG如何应用于合同文档管理

开源GraphRAG解读:微软的人工智能驱动知识发现方法

揭示微软开源的RAG策略:GraphRAG

Microsoft 的 GraphRAG实践

何时构建知识图谱驱动的GraphRAG系统 — 投入和产出分析

Vector | Graph:蚂蚁首个开源Graph RAG框架设计解读

GraphRAG工作原理揭秘及挑战

从RAG到GraphRAG: 用知识图谱帮助RAG链接数据 — 海外GenAI公司Chanko实践

[万字长文]GraphRAG技术栈及样例全面解析

GraphRAG应用中小图谱与大图谱的角色

GraphRAG:设计模式,挑战和落地指南

从RAG到GraphRAG的应用落地揭秘

快速医疗信息互操作标准FHIR上的GraphRAG

Neo4j与微软合作GraphRAG,以增强GenAI能力

Linkedin的GraphRAG客服问答系统实践

重磅-微软发表GraphRAG论文并即将开源项目

企业级RAG向量检索的限制和Writer的GraphRAG方案 - Part2

海外人工智能公司Writer的GraphRAG实践揭秘- Part1

LLM的前沿高效探索 - GraphRAG: 更好,更快,更便宜

微软的GraphRAG:智能问答系统的革命

从传统RAG到GraphRAG - 当大模型遇见知识图谱

深度解析知识图谱增强的GraphRAG及医药案例

基于知识图谱的RAG全生命周期知识增强 - GraphRAG

GraphRAG: 解锁大模型RAG知识增强

大模型&知识图谱双轮驱动的企业智能与分析用

用智能体优化智能体工具:Anthropic揭秘高效Agent开发新范式

基于知识图谱增强大模型的企业级智能知识库独角兽Glean获1.5亿美元F轮融资,估值72亿美元

DoorDash如何利用知识图谱增强大模型提升搜索召回精度

ESCARGOT:一种利用大模型、动态思维图和生物医学知识图谱以增强推理的AI智能体

论文浅尝 | CogMG:大语言模型与知识图谱的协同增强(ACL2024)

知识图谱增强大模型KERAP:多智能体推理语言模型在零样本诊断预测中的革新应用 - 哈佛大学&埃默里大学等

LLM vs LMM:知识图谱增强大模型驱动营销革新浪潮

BEKO:大语言模型与知识图谱的双向增强-吴信东

重磅发布|智护成长新纪元:知识图谱增强的儿童青少年健康管理智能体

MSG-LLM:多维度互动框架用于图谱增强大模型

[npj 数字医学]知识图谱增强的无幻觉医学信息大模型

DO-RAG:一种使用知识图谱增强检索辅助生成的领域特定问答框架 - 清华大学等

论文浅尝 | KnowGPT:利用知识图谱增强大型语言模型的专业领域问答能力(NeurIPS2024)

知识图谱增强的合规医学大模型产学研新范式探索

RAKG:文档级检索增强知识图谱构建 - 上海人工智能实验室等

AMG-RAG自适应知识图谱增强医学问答:弥合大模型与动态医学知识的差距 - 多伦多大学等

将知识图谱与大模型 (LLM) 协同化:实现语义增强智能的途径

利用大型语言模型增强知识图谱查询-意大利帕维亚大学

喜讯|柯基数据知识图谱增强的医学合规科研智能体荣获信通院智能体应用优秀案例

[论文解读]知识图谱引导的检索增强生成RAG - 南京大学&阿里巴巴

喜讯|柯基数据“知识图谱增强大模型”获得“国家电网科学技术进步奖”三等奖!

富士通推出知识图谱增强RAG软件分析和可视化服务,以支持企业最佳现代化规划流程

知识图谱增强营养健康大模型:迈向改进的管理、可重复性和验证 - RPI等

[2025论文解读]基于知识图谱的思考:一种知识增强的泛癌症问答大模型框架 - 中科院&广州国家实验室等

[VLDB24 KG+LLM论文]利用多模态和知识图谱增强大模型以实现无幻觉的开放集物体识别 - 河海大学等

medIKAL-知识图谱增强大模型以提升电子病历临床诊断能力

KG4Diagnosis - 知识图谱增强的多智能体大模型在医学诊断中的应用

北大Chatlaw - 基于知识图谱增强混合专家模型的多智能体法律助手

Stardog-知识图谱增强大模型企业智能体平台Voicebox的愿景

以内容为中心的粗粒度知识图谱增强大模型的实践研究 - DataStax

EMNLP 2024 | CoTKR:面向复杂知识图谱问答任务的思维链增强的知识改写方法

MedSyn:基于医学知识图谱增强大模型的合成医学文本生成框架

事实发现者 - 通过引入知识图谱增强大模型的生物医药领域专业知识(拜耳制药&IAIS)

KRAGEN:使用知识图谱增强的RAG解决生物医学大型语言模型问题




【声明】内容源于网络
0
0
知识图谱科技
1234
内容 1015
粉丝 0
知识图谱科技 1234
总阅读6.6k
粉丝0
内容1.0k