大数跨境

OpenCode OMO 深度解析——它不是插件,是一套 AI 开发团队的调度系统

OpenCode OMO 深度解析——它不是插件,是一套 AI 开发团队的调度系统 创见AI实验室
2026-04-06
3
导读:你以为它只是 OpenCode 的一个插件?实际上,它把单个 AI 对话入口,改造成了一套能自动拆任务、自动选模型、自动续跑、自动调子 Agent 的多 Agent 编排系统。
飞书文档 - 图片
你以为它只是 OpenCode 的一个插件?实际上,它把单个 AI 对话入口,改造成了一套能自动拆任务、自动选模型、自动续跑、自动调子 Agent 的多 Agent 编排系统。

如果你已经用了一段时间 OpenCode,可能遇到过这种情况:让 AI 改一个模块,它改了,但没考虑影响范围;让它做复杂重构,它做着做着就偏了;让它并行处理多个任务,它却一个接一个排队等。这不是 OpenCode 不行,而是单个 AI 的天花板——它再强,也只是一个人。

OMO 要解决的问题就是:你需要的不是一个人,而是一支团队。今天这篇,咱们把它拆开讲清楚。

一、OMO 到底是什么?

OMO(Oh My OpenAgent)是一个运行在 OpenCode 之上的多 Agent 编排框架,但它不是简单的功能增强包。

它的代码规模说明了一切:1,268 个TypeScript文件、约 16 万行代码,内部包含10 个专业 Agent40+ 生命周期 Hook20+ 工具和内置MCP。它不是简单扩展几个按钮,而是在 OpenCode 这个 AI 编程入口上,搭出了一套可持续运转的多 Agent 调度系统。

OMO 的定位官方叫"the best agent harness"——不是帮你写代码,而是帮你驾驭写代码的 AI 团队。它自己几乎不写代码,它的工作是:拆任务、选模型、调度 Agent、并行执行、续跑中断的会话

根据官网描述,OMO 的核心是"帮助你通过 OpenCode 创建一个由 AI 开发者组成的完整团队"

二、整体架构(三层设计)

OMO 采用三层架构,这是理解整个系统的关键:

飞书文档 - 图片

关键设计

层级
职责
Agent
核心特点
顶层路由
意图解析、模型选择
Sisyphus + Category
解析隐含意图,根据 category 自动选择模型
规划层
制定计划、质量把关
Prometheus, Metis, Momus
只规划不编码,Momus 不批准不执行
执行层
读取计划、委派任务、验收结果
Atlas
只协调不编码,独立验证一切
工作层
实际干活(编排/探索/写代码)
Sisyphus, Hephaestus, Oracle, Librarian, Explore, Junior
各司其职,Junior 实际写代码

常见误解纠正

  • ❌ "Sisyphus 和 Prometheus 是平级的" → ✅ Sisyphus 是顶层主编排器,Prometheus 是规划层 Specialist
  • ❌ "Atlas 也写代码" → ✅ Atlas 只协调不编码,代码由 Junior 写
  • ❌ "9 个 Agent 平铺" → ✅ 四层架构(顶层 + 三层),职责分离
三、为什么需要多 Agent?

单个 AI 最大的问题是什么?它能写代码,但不知道"谁该写什么、什么时候写、写完之后谁来审"。

当你让它"重构用户认证模块",如果是单 AI,它会自己从头干到尾——分析、设计、实现、测试,全包了。这听起来挺好,但问题是:它会越做越偏,中间没办法纠偏,而且不会并行。

OMO 的思路是:把这个大任务拆开,分给不同的专业 Agent 去干。一个 Agent 负责分析现有代码,一个 Agent 负责设计方案,一个 Agent 负责写代码,一个 Agent 负责审查,全部并行。

关键不是 Agent 多,而是

  • 谁来决定什么时候用哪个 Agent
  • 谁来决定任务要不要拆分
  • 谁来决定这个任务应该用哪个模型
  • 谁来决定做完一轮之后要不要继续
四、核心设计理念
1. 规划与执行分离(最重要)
飞书文档 - 图片
  • Prometheus
    :通过访谈模式确定范围,构建执行计划,从不写代码
  • Metis
    :捕获计划中的遗漏和歧义
  • Momus
    :严苛验证计划,只有无懈可击才批准
  • Atlas
    :执行已验证的计划,委派给专业 Agent,自己不写代码
  • Junior
    :实际写代码的执行者

核心:规划者不编码,编码者不规划。智能存在于系统中,而非单个 Agent。

2. 平权 Agent,自动路由

根据官方文档,OMO 的所有内置智能体都是平等的,没有"主从"关系,也不鼓励手动调用特定代理。你不需要指定@oracle@librarian——这些名称只是用来描述它们的专长,实际使用中,系统会根据任务自动选择合适的 Agent。

3. Trust But Verify(信任但验证)

编排器对一切进行独立验证。子 Agent 没有免费通行证——每个任务的结果都会被 Atlas 独立检查。

4. 会话连续性(Boulder 系统)

活跃工作被记录在boulder.json中。停电、系统崩溃、会话中断都没关系——从你停下的地方精确恢复,零上下文丢失。

5. Wisdom Accumulation(智慧积累)

每个任务的学习传递给后续所有任务。系统在工作时变得更聪明。

Code

.sisyphus/notepads/{plan-name}/
├── learnings.md      
├── decisions.md      
├── issues.md         
├── verification.md   
└── problems.md       
五、核心 Agent 团队详解(官网 10 个 + 内部 2 个)

官网宣传的 10 个专业 Agent

Agent
专长
推荐模型
核心职责
Sisyphus
主编排器
Claude Opus 4.6 Max
永不眠的 CTO。解析隐含需求,适应代码库成熟度,委派给专家。中断后通过 boulder 精确恢复
Prometheus
战略规划师
Claude Opus 4.6 Max
只规划不编码。通过访谈模式确定范围,构建执行计划。使用 Metis 和 Momus 作为质量关卡
Atlas
执行协调器
Claude Sonnet 4.6
只协调不编码。阅读已验证计划,通过 category+skills 系统委派给专业 Agent。独立验证结果
Hephaestus
深度工作者
GPT 5.3 Codex Medium
给他目标不是菜谱。启动 2-5 个并行 explore agent,专为深度架构推理和复杂调试设计
Oracle
架构顾问
GPT 5.4 High
只读模式,用于复杂调试和架构决策。当前路不明时调用
Librarian
文档/代码搜索
MiniMax M2.5
寻找真实 GitHub 示例和官方文档,基于证据,附带永久链接
Explore
代码探索
MiniMax M2.5 Highspeed / Grok Code Fast 1
超高速代码库搜索。便宜、并行、始终在后台运行
Metis
差距分析器
Claude Opus 4.6 Max
在计划中的歧义变成生产 Bug 之前捕获它们
Momus
严苛审查员
GPT 5.4 Extra High
只有当计划无懈可击时才批准
Dynamic Agent
按需构建
自动匹配
根据请求自动匹配最佳模型、注入所需技能,实时构建专属 Agent

实际代码中的内部 Agent(2 个,官网未单独计数)

Agent
专长
推荐模型
说明
Sisyphus-Junior
任务执行者
Claude Sonnet 4.6
实际写代码的执行者。Sisyphus 的内部执行模式,专注、纪律、验证
Multimodal Looker
视觉分析
GPT-5.4 Medium → Kimi K2.5 → GLM-4.6V
截图分析、视觉内容理解。实验性 Agent

为什么数量有差异?

  • Junior 是 Sisyphus 的内部执行模式,官网不单独计数
  • Multimodal Looker 是实验性 Agent,按需启用
  • Dynamic Agent 不是固定 Agent,是按需动态构建的

准确说法:官网宣传 10 个专业 Agent,实际代码实现 12 个(10 个固定 + 2 个内部/实验性)。

六、Category 路由:按任务类型选模型

OMO 不是按模型名委派任务,而是按任务类型委派。这是路由设计的核心思想。

Category
默认模型
适用场景
visual-engineering
Gemini 3.1 Pro (high)
前端、UI/UX、设计任务
ultrabrain
GPT 5.3 Codex (xhigh)
深度逻辑推理
deep
GPT 5.3 Codex (medium)
自主解决问题与深入研究
artistry
Gemini 3.1 Pro (high)
创意任务
quick
Claude Haiku 4.5
简单、快速任务
unspecified-low
Claude Sonnet 4.6
低投入一般任务
unspecified-high
GPT 5.4 (high)
高投入一般任务
writing
Gemini 3 Flash / Kimi K2.5
文档和写作
git
Claude Haiku 4.5
Git 操作

重要更新

  • quick
    默认是Claude Haiku 4.5,不是 GPT-5.4 Mini
  • unspecified-high
    默认是GPT 5.4 (high),不是 Claude Opus
  • deep
    ultrabrain用的是GPT 5.3 Codex,不是 GPT-5.4
七、核心模式与命令
7.1ulw——UltraWork 模式(魔法咒语)

这是 OMO 最常用的模式。在提示词中加上ulw(或ultrawork),OMO 会自动激活全部增强功能:

Code

ulw 增加一个搜索功能

系统执行流程

  • 扫描代码库
  • 启动 3 个 explore agent 并行探索
  • 构建执行计划
  • 部署 4 个并行 agent 执行
  • 运行验证测试
  • 输出完成结果

效果:自动规划、深度研究、并行 Agent、自我纠正循环。系统直到完成才会停止,你不需要盯梢。

7.2ralph-loop——无限迭代模式

适合需要"死磕到底"的场景。AI 会反复执行任务→自检→修复→再执行,直到满足条件或达到最大次数。

Code

/ralph-loop "修复所有单元测试,确保覆盖率>90%" --max-iterations 10
7.3/init-deep——深度初始化

在项目目录首次启动 OpenCode 后,执行/init-deep,它会探索整个工程,生成分层的AGENTS.md文件,帮助后续 Agent 快速理解项目。

7.4/start-work——执行已验证的计划

当 Prometheus 创建好计划后,运行/start-work激活 Atlas 执行:

  • 读取.sisyphus/plans/*.md计划文件
  • 分析任务依赖
  • 分发任务给专业 Agent
  • 独立验证每个任务结果
  • 积累智慧到.sisyphus/notepads/
八、配置详解
8.1 配置文件位置
  • 项目级
    .opencode/oh-my-openagent.json
  • 用户级
    ~/.config/opencode/oh-my-openagent.json

支持 JSONC 格式,允许注释和尾随逗号。

8.2 快速开始配置

Code

{
  "$schema": "https://raw.githubusercontent.com/code-yeongyu/oh-my-openagent/master/assets/oh-my-openagent.schema.json",
  "agents": {
    "oracle": { "model": "openai/gpt-5.4", "variant": "high" },
    "explore": { "model": "github-copilot/grok-code-fast-1" }
  },
  "categories": {
    "quick": { "model": "opencode/gpt-5-nano" },
    "visual-engineering": { "model": "google/gemini-3.1-pro" }
  }
}
8.3 可配置项
配置项
类型
说明
model
string
模型标识符(如 openai/gpt-4o)
variant
string
模型变体:max、high、medium、low
category
string
从分类继承配置
temperature
number
采样温度(0-2)
top_p
number
Top-p 采样(0-1)
prompt / prompt_append
string
覆盖或追加系统提示词
tools
object
启用或禁用特定工具
disable
boolean
禁用此 Agent
maxTokens
number
响应最大 token 数
reasoningEffort
string
推理强度:low、medium、high、xhigh

Code

{
  "$schema": "https://raw.githubusercontent.com/code-yeongyu/oh-my-openagent/master/assets/oh-my-openagent.schema.json",
  "agents": {
    "oracle": { "model": "openai/gpt-5.4", "variant": "high" },
    "explore": { "model": "github-copilot/grok-code-fast-1" }
  },
  "categories": {
    "quick": { "model": "opencode/gpt-5-nano" },
    "visual-engineering": { "model": "google/gemini-3.1-pro" }
  }
}
8.4 权限配置
权限
可选值
说明
edit
ask / allow / deny
文件编辑能力
bash
ask / allow / deny
Bash 命令执行
webfetch
ask / allow / deny
网络请求能力
doom_loop
ask / allow / deny
无限循环覆盖
external_directory
ask / allow / deny
访问项目外部文件
8.5 后台任务并发配置

OMO 支持同时运行多个后台 Agent,通过以下参数控制并发行为:

参数
类型
说明
defaultConcurrency
number
全局默认最大并发任务数
staleTimeoutMs
number
任务超时时间(毫秒),超时后可被终止
providerConcurrency
number
每个模型提供商(如 OpenAI、Anthropic)的全局并发限制
modelConcurrency
number
每个具体模型(如 gpt-5.4)的全局并发限制

并发优先级(从高到低):

modelConcurrency>providerConcurrency>defaultConcurrency

配置示例

说明

Code

{
  "backgroundTasks": {
    "defaultConcurrency": 5,
    "staleTimeoutMs": 300000,
    "providerConcurrency": 10,
    "modelConcurrency": 2
  }
}
  • defaultConcurrency: 5
    :最多同时运行 5 个后台任务。
  • providerConcurrency: 10
    :每个提供商最多同时 10 个任务(覆盖默认值)。
  • modelConcurrency: 2
    :每个具体模型最多同时 2 个任务(优先级最高)。
  • staleTimeoutMs: 300000
    (5 分钟):超过 5 分钟未完成的任务会被干预,避免资源长期占用。
8.6 内置 MCPs
  • websearch
    :由 Exa 驱动,提供高质量搜索结果
  • context7
    :文档检索和上下文管理
  • grep_app
    :GitHub 代码搜索集成
8.7 浏览器自动化
工具
描述
用例
playwright
完整浏览器自动化(默认)
测试、复杂交互
agent-browser
轻量级浏览器 Agent
快速查询、简单抓取
8.8 技能(Skills)

内置技能包括playwrightagent-browsergit-master。你也可以定义自定义技能:

Code

"skills": {
  "my-custom-skill": {
    "description": "A custom skill for specific tasks",
    "instructions": "Always use this skill when..."
  }
}
九、工作流程图
飞书文档 - 图片
十、安装与验证
10.1 一键安装

Code

bunx oh-my-openagent install

安装过程会问几个问题:有没有 Claude Pro 订阅?有没有 ChatGPT Plus?有没有 Gemini?没有的话直接选 No,OMO 会使用免费的 OpenCode Zen 模型。

10.2 验证安装

方法 1:运行诊断工具(推荐)

Code

bunx oh-my-openagent doctor

这会检查系统、配置、工具和模型解析,包括所有 Agent 是否正常。

方法 2:查看配置文件

Code

cat ~/.config/opencode/opencode.json

应该包含"oh-my-openagent"在 plugin 数组中:

Code

{
  "plugin": ["oh-my-openagent"]
}

方法 3:启动 OpenCode 测试

Code

opencode

然后在会话中输入:

Code

ulw test

如果 OMO 正常工作,会看到类似输出:

Code

正在扫描代码库...
正在启动 explore agent...
正在构建执行计划...
10.3 配置模型

在 OpenCode 中输入/models,可以看到可用模型列表。如果需要配置APIKey(如智谱GLMCoding Plan),输入/connect,选择对应供应商,粘贴 API Key 即可。

十一、常见问题
问题
解决方案
任务无限循环或卡死
使用 /undo 回退,或手动编辑.sisyphus/boulder.json 调整计划
boulder.json 指向错误
删除.sisyphus/boulder.json 重试
Atlas 执行后想退出
输入 exit 或新开会话
提示词没有触发 ulw 模式
手动在消息开头加上ulw
模型 API Key 无效
运行 /connect 重新配置
切换到 Prometheus 但没反应
Prometheus 默认进入访谈模式,回答它的问题后说"make it a plan"
/start-work说"no active plan found"
先用 Prometheus 创建计划,或删除 .sisyphus/boulder.json 重试
十二、OMO vs Superpowers vs OpenSpec

这三个工具各管一摊,不是互相替代的关系:

工具
核心职责
一句话
OMO
多 Agent 调度与并行执行
告诉 AI"谁来做、怎么并行"
Superpowers
强制 TDD、代码审查、流程约束
告诉 AI"怎么做才规范"
OpenSpec
规范文档、变更管理
告诉 AI"要做什么、做成什么样"

简单说:OpenSpec 定目标,Superpowers 管质量,OMO 提效率。三者配合才是完整的 AI 开发流水线。

十三、总结
要点
说明
本质
多 Agent 编排系统,不是简单插件
核心设计
规划与执行分离、平权 Agent、按任务类型路由模型、三层架构
最大价值
并行执行、自动拆任务、会话续跑、ulw一键激活
配置方式
支持项目级/用户级 JSONC 配置,灵活覆盖模型、权限、钩子
使用门槛
中(但有ulw可以无脑用)
适用场景
复杂项目、多文件重构、需要并行处理的任务

OMO 不是让 AI 更聪明,而是让 AI更有组织地干活。它把 OpenCode 从"一个 AI 助手"变成了"一支 AI 团队"的调度中心。

官网:https://ohmyopenagent.com/

GitHub:https://github.com/code-yeongyu/oh-my-openagent

你用过 OMO 吗?评论区聊聊你的使用体验。

系列文章回顾

【声明】内容源于网络
0
0
创见AI实验室
创见AI实验室,我们不只是介绍工具,我们共同创造工作方式的未来。
内容 147
粉丝 0
创见AI实验室 创见AI实验室,我们不只是介绍工具,我们共同创造工作方式的未来。
总阅读20
粉丝0
内容147