从Atypica的实践看企业智能体系统的构建- 大数跨境

首页

从Atypica的实践看企业智能体系统的构建

atypica.AI

2025-12-24

背景

Atypica 是一个消费者研究的智能体。
目标是让 AI 能独立完成用户研究：

规划研究项目
通过社交媒体拟合虚拟消费者
进行消费者访谈
生成洞察报告

这篇文章记录了研发过程的经验教训，以及提炼出的一套通用企业级智能体架构思路（GEA - Generative Enterprise Agent）。

挑战

消费者研究不是确定性交付产出的工作，而是具有「探索性的知识工作」。

具体的挑战如下：

问题1：用户的需求模糊

用户会问："想了解年轻人对咖啡的偏好"

但这不够具体：

哪个年龄段的年轻人？
关注哪些维度？价格？品牌？场景？
用什么方法？观察？访谈？问卷？
产出什么？用户画像？策略建议？

😢 传统做法：会让用户用更清晰的问题来提问

✅ 我们的尝试：

澄清需求：多轮对话澄清需求
意图构建：从用户输入、团队历史、已有 Persona 中直接组装一个可执行的研究意图。

问题2：Context 很难管理

做一次研究会产生大量 Context：

社交媒体观察结果（几百条内容）
用户画像（Persona）
历史研究模板
中间推理过程

这些 Context：

有些是长期的（Persona 库）
有些是临时的（当前对话）
需要被过滤（噪音很多）
需要被关联（相似研究能被找到）

😢 传统做法：RAG 检索 → 问题；检索只是第一步，还需要持续整理

✅ 我们的尝试：把 Context 当作一个系统来管理：让对的资产在对的时间可用。

问题3：Agent 需要持续调整方向

做研究不是线性流程：

观察 → 发现矛盾信号 → 需要深度访谈
某个数据源无效 → 需要换方向
洞察已经清晰 → 应该停止探索

这需要一个 Agent 持续做判断，而不是按预设流程执行。

😢 传统做法：Multi-Agent 各司其职 → 问题：谁来做这个"持续判断"的角色？

✅ 我们的尝试：

分成两个 Agent：

Reasoning Agent：做判断和决策
Execute Agent：执行具体任务

Reasoning Agent 负责准备 Context、判断下一步、调整方向。

问题4：经验难以复用

每次研究都会积累经验：

某个领域的用户画像
某个平台的观察方法
某种问题的访谈框架

这些经验如果不沉淀，下次又要从头开始。

😢 传统做法：

文档或工具调用 → 问题：文档不够结构化，工具调用不够灵活

✅ 我们的尝试：

把经验代码化为 Skills ——可以被动态加载的能力模块。

过去产品积累

我们有一个产品 DAM，管理用户所有的内容，小到个人大到企业。这个内容管理工具是内容的唯一真相空间，存储图、文、视频、文件等非结构化数据，每一个文件背后都是已经人工和自动解析好的metadata。因此，天然成为了我们Agent的上下文管理系统。

Atypica 的工作流程

以一个典型的研究任务为例：
"想了解年轻人对咖啡的偏好"

1. Intent 构建

｜从 Memory（团队关注视觉）、Assets（茶饮研究）组装意图

系统不会让你填表或多轮对话澄清。它直接从你的问题、团队历史、现有 Persona 库中构建一个可执行的研究意图：

2. Reasoning Agent 开始推理

｜观察 → 访谈 → 报告准备：加载 scoutTask Skill、准备社交媒体 MCP

推理 Agent 规划执行路径，准备 Context：

加载 scoutTaskChat skill（社交媒体观察）
准备 system prompt 和相关 tools
从 Persona 库检索相关用户画像
设置推理触发条件（5次观察后深度分析）

3. Execute Agent 执行

｜按 scoutTask 方法观察小红书/抖音，收集 120+ 条内容。发现："说重视性价比，但为高颜值付费"

执行 Agent 根据准备好的 Context 工作：

Scout 在小红书/抖音观察用户讨论
收集 120+ 条内容，识别关键模式
触发 reasoningThinking 深度分析
发现洞察："价格敏感 + 视觉导向，但为颜值付费"

4. Context 持续整理

｜推理 Agent 根据执行结果调整策略：

矛盾信号？加载 interview skill，深度访谈验证
信息不足？调整 scout 观察维度
洞察清晰？加载 reportGen skill，生成报告

整个过程中，Context 不断被过滤、提炼、重组。

5. 资产沉淀

研究完成后，新资产进入 DAM 系统：

新 Persona 自动入库（Z世代咖啡消费者画像）
研究意图模板化（可复用于茶饮、奶茶研究）
Knowledge Gaps 记录（微博该人群讨论少）

下次类似研究，系统更聪明。

GEA架构

为实现上述工作流程，我们的架构逐渐形成了四个核心部分：

Reasoning 和 Execute 持续与 Context System 交互：获取记忆、访问数据、加载方法。

1. Intent Layer（意图层）

作用：把模糊输入变成可执行意图

具体做法：

解析用户输入
匹配团队历史（类似研究、相关 Persona）
生成结构化的研究意图

产出：一个包含研究对象、方法、产出的明确意图

2. Context System（上下文系统）

作用：管理各种 Context 资产

两个维度：

Build Time：长期资产（Persona 库、研究模板、Skills）
Runtime：会话 Context（对话历史、观察结果、推理记录）

核心能力：

语义索引（不只是关键词）
动态过滤（去噪）
关联推荐（找相关资产）

3. Reasoning Agent（推理引擎）

作用：持续推理和决策

具体工作：

规划执行路径
准备 Context（为 Execute Agent 准备 prompts、tools、skills）
判断何时调整方向
决定何时停止

不做什么：不直接执行任务（交给 Execute Agent）

4. Execute Agent + Skills

Execute Agent：

足够通用的执行器
完全依赖 Reasoning Agent 准备的 Context
动态加载 Skills

Skills（atypica 的具体 Skills）：

scoutTaskChat：社交媒体观察
interviewChat：用户访谈
buildPersona：生成用户画像
reportGen：生成报告

Skills 渐进披露

只在需要时加载完整内容，避免 Context 臃肿。

关于 Skills 概念的来源

"Universal Agent + Skills Library" 的理念来自 Anthropic 在 2025 年的思考——不是构建多个专用 Agent，而是一个通用 Agent 配合可组合的 Skills。我们认同这个方向。在 Atypica 的实践中，我们结合双 Agent 架构来使用 Skills，并在消费者研究场景做了具体应用。

和其他架构的差异

GEA 不是替代 RAG 或 Multi-Agent，而是在「探索性的知识工作」场景的一种实践。

1. Content 和 RAG 的差异：

GEA采用Context System，而没有只使用RAG。在RAG基础上增加了持续整理和资产管理——不只是检索，还要过滤噪音、建立关联、及时更新。因此Content System比RAG更动态。

2. 双Agent 和 Multi-Agent 的差异：

GEA采用双Agent架构，即：Reasoning Agent和Execute Agent，而没有选择Multi-Agent。Multi-Agent也有多个能力单元（Skills），但用双 Agent 分离推理和执行，Skills 作为 Context 动态加载，不是固定的多个 Agent，而是可组合的能力模块。因此双Agent比Multi-Agent更有通用性。

双 Agent 架构对比