智能系统设计模式系列第八篇-内存管理：记忆是通往真正智能的桥梁- 大数跨境

首页

智能系统设计模式系列第八篇-内存管理：记忆是通往真正智能的桥梁

AI驱动数字化转型

2025-12-28

导读：当我们为智能体精心设计了记忆之后，一个自然而然的问题浮出水面：它该如何利用这些记忆来让自己变得更聪明？如何从经验中学习，根据新情况调整自己的行为？这便是我们下一章将要探讨的主题：“学习与适应”。记忆，

我们与人交往，最怕的是什么？或许不是意见不合，也不是言语冲突，而是一个人反复问你：“你是谁？”那种感觉，仿佛你们之间所有的过往都被一块橡皮擦干净，只剩下冰冷的、初次见面的陌生。一个“健忘”的人，很难与我们建立深刻的连接。

在人工智能的世界里，这个道理同样适用。一个没有记忆的智能体，就像一个永远活在“当下”的过客，你每次与它对话，都是一次全新的开始。它无法记住你的名字、你的偏好，更无法理解你们上次聊到一半的话题。这样的智能体，充其量只是一个机械的问答工具，离我们期待的那个聪明、体贴的“伙伴”相去甚远。

所以，让智能体拥有记忆，是它从一个简单的工具进化为真正智能助手的关键一步。这不仅仅是存储信息那么简单，它关乎上下文的维系、经验的积累和个性的塑造。有效的内存管理，就如同为智能体安装了一颗既能快速反应又能深思熟虑的大脑。本章，我们将一起探索这门构建智能体记忆的艺术，看看如何让我们的造物，拥有“记住”的能力。

大脑的双核系统：短期记忆与长期记忆

人类的记忆系统并非铁板一块，我们既有处理眼前事务的“工作记忆”，也有存储人生经历的“长期记忆”。智能体的内存设计，也巧妙地借鉴了这种二元结构，分为短期记忆和长期记忆。这两种记忆协同工作，构成了智能体感知和回应世界的基础。

转瞬即逝的火花：短期记忆（情境记忆）‍

短期记忆，我们可以把它想象成智能体面前的一块小小的、透明的白板。当一次对话开始时，所有即时的信息，比如你刚刚说的话、智能体自己的思考过程、调用工具后返回的结果，都会被迅速记在这块白板上。这块白板的内容，就是大语言模型（LLM）进行下一次思考和回应的全部依据。在技术术语里，这块白板就是模型的“上下文窗口”。

这个窗口是智能体的“当下意识”，它让对话能够连贯地进行下去。如果没有它，你问“北京天气怎么样？”，它回答“晴朗”，你接着问“那适合穿什么？”，它可能会一脸茫然，因为它已经忘了你们在讨论北京。

然而，这块白板的容量是有限的。过去的模型，上下文窗口可能只有几千个词，就像一张便利贴，写满了就得擦掉旧的。即便在2025年的今天，我们拥有了所谓的“长上下文”模型，窗口容量扩展到了数百万词，但这本质上只是把便利贴换成了一块大白板。白板再大，也有写满的时候，而且维护这块大白板的成本（计算资源和时间）也相当高昂。

更重要的是，短期记忆是“挥发性”的。一旦对话结束，或者系统重启，这块白板上的所有内容都会被擦得一干二净。它就像一场梦，醒来无痕。因此，要想让智能体真正地积累知识、形成经验，我们就必须依赖另一种更持久、更深邃的记忆。

沉淀智慧的海洋：长期记忆（持久记忆）‍

如果说短期记忆是浪花，那么长期记忆就是深邃的海洋。它负责存储那些需要跨越时间、跨越对话边界的信息。这包括用户的个人偏好（比如“我喜欢喝拿铁，不加糖”）、成功的任务经验（“上次就是通过这三个步骤成功预订了机票”），或是智能体从外部文档中学到的专业知识。

长期记忆通常存储在智能体外部的“知识库”中，这个知识库可以是传统的关系型数据库、知识图谱，但如今，最主流、最强大的选择是向量数据库。

这个概念听起来可能有点硬核，但它的原理却非常美妙。传统数据库通过精确的关键词来查找信息，就像一个只会按字母顺序翻字典的图书管理员。而向量数据库，则是将所有的信息（文字、图片、声音）都通过一个叫做“嵌入模型”的魔法，转化成一串由数字组成的“向量”。这个向量，可以被看作是信息在多维空间中的一个“坐标”，它捕捉了信息的核心语义。

有了这个坐标，查找信息的方式就发生了革命性的变化。我们可以通过计算向量之间的“距离”来判断它们的相似度。这就像一位懂行的图书管理员，你告诉他“我想找一些关于勇气和冒险的故事”，他不会只去找书名里有“勇气”和“冒险”的书，而是会为你推荐《堂吉诃德》或者《老人与海》，因为他理解这些故事背后蕴含的深层含义。

这种基于语义相似性的搜索，我们称之为“语义搜索”。它让智能体能够真正“理解”并“联想”，从海量的信息中，精准地捞取与当前情境最相关的那一针。这正是检索增强生成（RAG）技术的核心所在，也是智能体能够引经据典、言之有物的基础。

记忆的应用场景：智能体因记忆而强大

拥有了短期和长期记忆的智能体，其实力会发生质的飞跃。它不再是一个冰冷的机器，而是在各种场景中展现出令人惊叹的智慧和“人情味”。

对话的艺术：在与聊天机器人的互动中，短期记忆确保了对话的流畅自然。而长期记忆则让机器人“认识”你。它会记得你上次提到的宠物狗的名字，记得你对某个话题的看法，甚至记得你的生日。这种被记住的感觉，是建立信任和情感连接的第一步。
任务的向导：对于需要分多步完成的复杂任务，比如规划一次旅行或者完成一份市场分析报告，短期记忆至关重要。它就像一个任务清单，时刻记录着“我们进行到哪一步了”、“下一步该做什么”、“最终目标是什么”。没有它，智能体会在复杂的流程中迷失方向。
专属的体验：长期记忆是实现个性化的基石。一个电商导购智能体，如果能记住你的穿衣风格、尺码和预算，它推荐的商品就会精准得多。一个健康管理智能体，如果能长期跟踪你的饮食和运动数据，它提出的建议也会更具针对性。
成长的轨迹：智能体可以通过记忆来学习和进化。一次成功的交互策略、一个曾经犯过的错误、一条用户反馈的新信息，都可以被存储在长期记忆中。通过强化学习或反思机制，智能体可以回顾这些“经验”，在未来的决策中表现得更好。这使得智能体拥有了自我完善的能力。
知识的源泉：在信息检索场景中，长期记忆本身就是智能体的知识大脑。当一个法律咨询智能体被问到一个具体的案件问题时，它会通过RAG技术，在存储了海量法律条文和判例的向量数据库（它的长期记忆）中进行检索，然后结合检索到的信息，生成精准、可靠的回答。

从自动驾驶汽车需要记住地图和驾驶规则，到机器人需要记住操作流程和环境布局，记忆无处不在。它是智能体维护历史、学习成长、管理复杂问题、并最终与我们建立深度协作关系的核心能力。

实战演练：构建智能体的记忆系统

理论讲了这么多，让我们卷起袖子，看看在实际的代码世界里，如何为智能体构建记忆系统。我们将以两个业界主流的智能体开发框架，Google Agent Developer Kit (ADK) 和 LangChain/LangGraph 为例，一探究竟。

Google ADK：工业级的记忆管家

Google ADK 提供了一套结构清晰、高度工程化的组件来管理内存。它就像一个专业的管家，把智能体的记忆打理得井井有条。核心概念有三个：

Session（会话）
‍：可以理解为一本“对话日志”。每一次独立的聊天，就是一个 Session。它记录了这次聊天中所有的消息和操作。
State（状态）
‍：附在当前日志页上的一张“便利贴”。它用来存放只在当前这次对话中有效的临时数据，比如用户正在填写的表单信息。
Memory（记忆）
‍：连接到外部的一个庞大的“中央图书馆”，也就是我们前面说的长期记忆库。

管理这些组件的服务分别是 SessionService 和 MemoryService。

SessionService 负责管理对话日志的生命周期。ADK 提供了多种实现方式，让开发者可以根据需求选择。

比如，在本地开发测试时，我们可以使用 InMemorySessionService。它速度飞快，但所有数据都存在内存里，程序一关，日志和便利贴就都丢了。

# 示例：使用 InMemorySessionService
# 适合本地开发和测试，数据在程序重启后不保留
from google.adk.sessions import InMemorySessionService

session_service = InMemorySessionService()

到了生产环境，我们需要数据持久化，这时就可以用 DatabaseSessionService，把对话日志可靠地存入你自己的数据库（比如 PostgreSQL 或 SQLite）。

# 示例：使用 DatabaseSessionService
# 适合需要持久化存储的生产环境
# 需要安装 sqlalchemy 和相应的数据库驱动
from google.adk.sessions import DatabaseSessionService

# 使用本地 SQLite 文件作为示例
db_url = "sqlite:///./my_agent_data.db"
session_service = DatabaseSessionService(db_url=db_url)

如果你的应用部署在谷歌云上，追求极致的扩展性和稳定性，那么 VertexAiSessionService 则是最佳选择，它利用了谷歌云强大的基础设施。

而 session.state 这张“便利贴”也大有讲究。它本质上是一个 Python 字典，但通过特殊的键前缀，可以实现不同范围的数据共享：

没有前缀：数据只属于当前这次会话。
user:
前缀：数据属于这个用户，在他所有的会话中共享。比如 user:theme_preference 可以记录用户偏好的主题色。
app:
前缀：数据在应用的所有用户间共享。比如 app:announcement 可以存放一个全局公告。
temp:
前缀：数据只在当前这一轮处理中有效，用完即焚，不会被保存。

更新 State 的方式也很有讲究。官方强烈建议不要直接去修改 session.state 字典，这会绕开标准的记录流程，导致数据不一致。推荐的方式有两种：对于简单的文本回复，可以直接在定义 Agent 时使用 output_key 参数；对于复杂的更新，则应该在附加事件时，通过 EventActions.state_delta 来声明状态的变更。

而最优雅、最推荐的方式，是通过“工具”来封装状态的变更。这样做的好处是逻辑内聚，代码清晰。我们来看一个用户登录时更新状态的例子：

import time
from google.adk.tools.tool_context import ToolContext

# 定义一个工具，专门负责处理用户登录时的状态更新
deflog_user_login(tool_context: ToolContext) -> dict:
"""当用户登录时，更新会话状态。"""
    state = tool_context.state # 通过上下文直接访问 state

# 读取旧值，计算新值，然后更新
    login_count = state.get("user:login_count", 0) + 1
    state["user:login_count"] = login_count
    state["task_status"] = "active"
    state["user:last_login_ts"] = time.time()
    state["temp:validation_needed"] = True

print("状态已在 `log_user_login` 工具内部更新。")
return {"status": "success", "message": f"用户登录已记录。总登录次数：{login_count}。"}

在这个例子里，所有和“用户登录”相关的状态修改都被封装在 log_user_login 这个工具函数中。当智能体的大脑（LLM）判断用户正在执行登录操作时，它就会调用这个工具。代码逻辑清晰，易于维护。

对于长期记忆，ADK 则通过 MemoryService 来管理。同样，它也提供了 InMemoryMemoryService 用于测试，以及 VertexAiRagMemoryService 用于生产环境，后者直接对接了谷歌云强大的 RAG 服务，让你的智能体可以轻松地拥有一个可扩展、可语义搜索的长期知识库。

LangChain & LangGraph：灵活的记忆组件

如果说 ADK 像一个严谨的工业管家，那么 LangChain 和 LangGraph 就更像一个装满了各种乐高积木的工具箱，让你可以灵活地、创造性地搭建智能体的记忆系统。

对于短期记忆，LangChain 提供了简单易用的 ConversationBufferMemory。它可以自动捕获对话历史，并将其作为一个变量（比如 history）插入到你的提示模板中。这样，LLM 在生成回复时，就能看到之前的对话内容。

from langchain_openai import OpenAI
from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate
from langchain.memory import ConversationBufferMemory

# 1. 定义 LLM 和提示模板
llm = OpenAI(temperature=0)
template = """你是一个乐于助人的旅行代理。

之前的对话:
{history}

新的问题: {question}
回答:"""
prompt = PromptTemplate.from_template(template)

# 2. 配置内存，memory_key 必须和模板中的变量名一致
memory = ConversationBufferMemory(memory_key="history")

# 3. 构建链，将内存集成进去
conversation = LLMChain(llm=llm, prompt=prompt, memory=memory)

# 4. 开始对话
response = conversation.predict(question="我想订一张机票。")
print(response)
response = conversation.predict(question="顺便说一下，我叫山姆。")
print(response)
response = conversation.predict(question="我的名字叫什么来着？")
print(response)

这段代码运行后，你会发现智能体能够轻松记住你的名字“山姆”，这就是 ConversationBufferMemory 的功劳。

而当涉及到长期记忆时，LangChain 和 LangGraph 的设计思想更加深刻。它将长期记忆类比为人类的三种记忆类型：

语义记忆（Semantic Memory）
‍：记住事实。这就像我们知道“地球是圆的”一样。在智能体中，这通常是用户的个人档案、偏好设置或领域知识。它可以是一个 JSON 文档，也可以是一系列事实陈述。
情景记忆（Episodic Memory）
‍：记住经历。这就像我们记得“昨天下午和朋友喝了杯咖啡”。对智能体而言，这通常是记住一次成功的任务执行过程。在实践中，这常常通过“少样本提示”（Few-shot Prompting）来实现，即给智能体看几个成功的范例，让它学习如何完成任务。
程序记忆（Procedural Memory）
‍：记住如何做。这是关于“如何执行任务”的记忆，也就是智能体的核心指令和行为准则，通常定义在它的系统提示（System Prompt）中。

最有趣的是程序记忆的更新。LangGraph 提出了一种叫做“反思”（Reflection）的机制。智能体可以在完成一次任务后，回顾整个过程（情景记忆），然后反思自己的核心指令（程序记忆）是否需要优化，并生成新的指令来更新自己。这就像一个厨师在做完一道菜后，品尝、反思，然后决定下次要调整一下盐的用量。这让智能体具备了真正意义上的“自省”和“进化”能力。

LangGraph 通过一个叫做 Store 的组件来持久化这些长期记忆。你可以创建不同的命名空间（就像文件夹）和键（就像文件名）来精细地组织和检索这些记忆。

Vertex AI Memory Bank：云端的记忆大脑

最后，值得一提的是 Google Cloud 提供的 Vertex AI Memory Bank。它是一项托管服务，可以看作是为智能体提供了一个“外接的、智能的海马体”。

它的独特之处在于“主动性”。你不需要手动去分析对话、提取要点然后存入数据库。Memory Bank 会使用 Gemini 模型，在后台异步地分析对话历史，自动提取出关键事实和用户偏好，然后智能地存入长期记忆库。它还会处理信息的更新和冲突，比如用户说“我最喜欢蓝色”，后来又说“我现在更喜欢绿色了”，Memory Bank 会智能地更新这一偏好。

当新的对话开始时，智能体可以从 Memory Bank 中检索所有相关的记忆，从而带着对用户的全面了解来开启对话。它与 Google ADK 无缝集成，同时也提供了 API，可以方便地与 LangGraph 等其他框架结合使用，为开发者提供了一个开箱即用、功能强大的长期记忆解决方案。

设计的权衡与智慧

构建内存系统并非一个“一招鲜，吃遍天”的任务，它充满了设计的权衡和取舍。

首先是 延迟、成本与准确性 的平衡。将所有信息都塞进短期记忆（上下文窗口）中，检索延迟最低，因为模型可以直接看到，但成本最高，且容量有限。而将信息存储在外部的向量数据库中，存储成本相对较低，可以无限扩展，但每次检索都会引入额外的网络延迟和计算开销。检索到的信息是否足够准确、足够全面，也直接影响最终生成结果的质量。

其次是 记忆的更新与遗忘 机制。一个只进不出的记忆系统是危险的，它可能会被过时或错误的信息“污染”。如何让智能体优雅地更新知识，甚至“忘记”某些不再需要的信息，是一个复杂但重要的问题。LangGraph 的“反思”机制提供了一个很好的思路，即通过自我审视来迭代更新程序记忆。对于事实性记忆，则需要设计合理的更新策略，比如基于时间戳或可信度评分来决定信息的去留。

最后，我们如何 评估一个记忆系统的好坏？这不能简单地看它存了多少信息。我们需要一套科学的评估方法。比如，对于 RAG 系统，我们可以用信息检索领域的经典指标，如精确率（Precision）‍和召回率（Recall）‍，来衡量检索到的信息有多准、有多全。同时，我们也要关注端到端的响应延迟和存储成本，确保系统在实际应用中是高效和经济的。

记忆是通往真正智能的桥梁

本文，我们深入探讨了智能体内存管理的方方面面。我们理解了短期记忆与长期记忆的本质区别和协同关系，看到了它们在各种应用场景中赋予智能体的强大能力。我们还通过 Google ADK、LangChain 等主流框架的实战代码，了解了如何动手构建这些记忆系统。

我们必须认识到，记忆，对于智能体而言，绝不仅仅是数据的存储。它是构建上下文的基石，是实现个性化的前提，是驱动学习和进化的燃料。一个拥有了良好记忆系统的智能体，才能真正地理解我们，与我们建立持续、深入的互动，从一个冰冷的工具，蜕变为一个有温度、有智慧的伙伴。

当我们为智能体精心设计了记忆之后，一个自然而然的问题浮出水面：它该如何利用这些记忆来让自己变得更聪明？如何从经验中学习，根据新情况调整自己的行为？这便是我们下一章将要探讨的主题：“学习与适应”。记忆，正是这座通往更高阶智能的必经之路。

文章核心内容来自开源书籍《智能系统设计模式：构建智能系统的实战指南》（作者：Antonio Gulli）

【声明】内容源于网络

AI驱动数字化转型

专注AI，促进智造行业数据衍生，服务智能制造企业的数字化、智能化，聚焦大模型私域部署、大模型微调、数据清洗、AI模型训练、私域知识库及agent技术延展等。行业智能，落地为先。

内容 827

粉丝 0

AI驱动数字化转型专注AI，促进智造行业数据衍生，服务智能制造企业的数字化、智能化，聚焦大模型私域部署、大模型微调、数据清洗、AI模型训练、私域知识库及agent技术延展等。行业智能，落地为先。

总阅读594

粉丝0

内容827