RAG 和 MCP 如何以不同方式解决模型限制- 大数跨境

索引目录

2025-04-17

导读：像 Claude 和 GPT-4 这样的大型语言模型 (LLM) 拥有令人印象深刻的功能，但也面临两个主要限制

像 Claude 和 GPT-4 这样的大型语言模型 (LLM) 拥有令人印象深刻的功能，但也面临两个主要限制：它们包含的知识在时间上（更具体地说，是在训练时）是冻结的，并且决定它们一次可以处理多少信息的上下文窗口是有限的。检索增强生成(RAG) 和模型上下文协议(MCP) 可以解决这些限制。在本文中，我将概述它们的工作原理，并介绍它们之间的一些区别。

检索增强生成

RAG 是一种增强 LLM 性能的技术，它通过引入一个独立的检索系统来增强 LLM，该系统会在模型生成响应之前从外部来源收集相关信息。RAG 的工作原理主要分为三个步骤：

查询处理：处理用户的查询以确定关键信息需求。
检索：从外部数据库或知识库中获取相关文档或信息片段。
增强生成：检索到的文档被添加到 LLM 的上下文窗口，然后 LLM 根据其预先训练的知识和收集到的信息生成响应。

这种方法弥合了静态预训练知识和动态信息检索系统之间的差距。

RAG 的主要优势

提高准确性，提供真实、最新的信息
利用知识库中的信息减少幻觉
从特定领域来源获取的可定制知识
通过来源提供的引用实现透明度

想象一下一个由学生提示的大学聊天机器人：

"When is the CS301 final exam?"

使用 RAG 实现，系统将：

a) 处理此查询
b) 从大学数据库中检索当前学期的考试安排
c) 将此信息与查询一起提供给 LLM

然后，法学硕士将根据最新信息生成准确的答复，

"The CS301 final exam is scheduled for December 15th at 2:00 PM in Lecture Hall B."

RAG 允许系统访问最新信息和专业知识，而无需重新训练模型。

模型上下文协议

MCP 采用不同的方法来扩展 AI 功能。RAG 专注于生成前的检索，而 MCP 则为 LLM 提供了标准化接口，以便在生成过程中请求附加信息或执行操作。MCP 的工作原理如下：

识别：模型识别何时需要额外的信息或工具。
协议执行：按照预定义的协议，模型输出结构化请求。
外部处理：此请求由外部系统处理以获取数据或执行操作。
持续生成：模型整合结果并继续其响应。

MCP 的主要优势

上下文优化，充分利用有限的上下文窗口
使用模型更能理解的模式和格式的结构化信息
信息层次结构，优先考虑任务的关键信息
一致性为可预测的模型行为提供标准化格式
在相同上下文大小下实现更好的推理的性能改进

在处理需要多个信息源但必须在模型的上下文窗口容量限制内运行的复杂任务时，MCP 尤其有价值。

使用 MCP 实现的大学聊天机器人场景，当学生询问 CS301 考试时：

a) 模型识别出它需要当前的考试安排
b) 它生成结构化的 MCP 调用：

{action: "fetch_exam_schedule", course: "CS301", semester: "current"}

c) 外部系统处理此调用并返回考试详情

该模型将这些信息纳入响应中，

"The CS301 final exam is on December 15th at 2:00 PM in Lecture Hall B."

结论

RAG 和 MCP 都是扩展 AI 能力、突破其初始训练限制的强大方法。RAG 通常更易于实现，并且非常适合简单的信息检索。MCP 则为需要多种工具和数据源的复杂、多步骤任务提供了更大的灵活性。

在实践中，许多先进的人工智能系统开始将两种方法的元素结合起来——使用 RAG 进行广泛的知识访问，使用 MCP 进行特定工具的使用和动态信息检索。当您开始开发更多人工智能应用时，请考虑哪种方法或两种方法的组合更适合您的具体用例。

【声明】内容源于网络

索引目录

索引目录是一家专注于医疗、技术开发、物联网应用等领域的创新型公司。我们致力于为客户提供高质量的服务和解决方案，推动技术与行业发展。

内容 444

粉丝 0

索引目录索引目录是一家专注于医疗、技术开发、物联网应用等领域的创新型公司。我们致力于为客户提供高质量的服务和解决方案，推动技术与行业发展。

总阅读12

粉丝0

内容444