31个命令,覆盖CEO、设计、工程、QA、安全、发布全流程
你有没有遇到过这种情况:
产品做到一半,突然觉得哪里不对。设计上好像有缺陷,工程上可能有 bug,安全上可能有问题,发布流程也是一团糟。你看着屏幕,不知道该从哪里下手。
这时候你最想要什么?
一个 CEO 帮你看产品方向,一个设计师帮你审设计,一个工程经理帮你管代码质量,一个QA帮你跑测试,还有一个安全工程师帮你检查漏洞。
问题是:你请得起这些人吗?
Garry Tan 请得起。他是 YC(Y Combinator)的 CEO,全球最顶级孵化器的掌门人。但他做的不是招聘这些人,而是把这些人「做」成了 AI 工具。
这个工具叫gstack。
gstack 是 GarryTan在 2025 年开源的一个 AI 编程辅助工具,目前在GitHub上有 61.6k star(数据截止 2026-04-02 20:49)。
它的官方定义是:
23 opinionated tools that serve as CEO, Designer, Eng Manager, Release Manager, Doc Engineer, andQA.
翻译成人话就是:它不是一个人在帮你写代码,而是一整个工程团队在帮你。
这个团队的成员包括:
- CEO
— 帮你审视产品方向 - Designer
— 帮你处理设计系统 - Eng Manager
— 帮你管代码质量和发布流程 - Release Manager
— 帮你发布和部署 - Doc Engineer
— 帮你写文档 -
QA— 帮你做端到端测试
31 个命令,分成几大类,覆盖了产品开发的各个角落。
我知道 31 个命令听起来很多。但其实你可以分批学,先挑最常用的入手。
如果你经常做到一半才发现产品方向有问题,这类命令能帮你提前发现问题。
|
|
|
|---|---|
|
|
|
|
|
|
我第一次用/plan-ceo-review的时候,它问我:「你的用户是谁?他们为什么不用竞品?」
我愣住了。我的产品定位其实没有我想的那么清晰。
这类命令的价值不是给你答案,而是帮你发现自己没想过的问题。
|
|
|
|---|---|
|
|
|
|
|
|
说实话,这类命令我用的不多。因为我的设计基本靠 Tailwind + shadcn/ui,自己不需要从零搭设计系统。
但如果你在做一个需要独特视觉风格的产品,/design-consultation能帮你省不少时间。
这类命令是 gstack 的核心,也是我使用频率最高的。
|
|
|
|---|---|
|
|
|
|
|
|
/review是我最喜欢的命令。
它的逻辑不是「你的代码有没有错」,而是「你的代码在什么场景下会出错」。
它会模拟各种边界条件:并发请求、空数据、网络超时、极端用户输入……然后告诉你你的代码在这些情况下会怎么表现。
而且它会自动修复那些明显的 bug(死代码、N+1 查询等),但对真正复杂的问题(安全、并发、设计决策)会停下来问你。
用过之后我才发现,我的代码在并发场景下有race condition。这种问题在本地测试几乎不可能发现。
|
|
|
|---|---|
|
|
|
/cso我只在重要项目上用。不是每个小工具都需要安全审计,但如果你在做支付、用户数据、登录认证这类功能,花 10 分钟跑一下/cso很值得。
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
这些命令把整个发布流程自动化了。
以前我的发布流程是:本地测试 →push→ 等CI→ 创建PR→ 等审查 → 合并 → 等部署 → 手动验证。
用 gstack 的话,一个/land-and-deploy就搞定了。它会等CI通过,等审查通过,然后自动合并和部署。
|
|
|
|---|---|
|
|
|
|
|
|
/browse是个很有意思的命令。它不是简单的网页爬虫,而是真正的浏览器操作:点击、填表、滚动、截图。
配合/qa使用,你可以让 AI 在真实浏览器里跑完整的 E2E 测试。
/codex则是让另一个 AI 来审查你的代码。两个不同的 AI 模型,视角不同,能发现的问题也不同。
我猜你更关心的是:这个工具在 OpenCode 里能不能用?
答案是:官方版本不支持 OpenCode。
gstack 官方版本只支持 Claude Code。GarryTan开发这个工具的时候,瞄的就是 Claude Code 的工具调用能力。
但是,社区有人做了适配版本:TMFNK/gstack-OpenCode。
这个社区版本把 gstack 的核心功能适配到了 OpenCode 上。虽然功能可能没有官方版本那么完整,但核心命令基本都能跑。
如果你想用 gstack,有两个选择:
- 用 Claude Code
— 完整支持,但需要订阅 Claude - 用 OpenCode + 社区适配版
— 功能基本够用,免费
我目前用的是第二个方案。社区适配版有一些命令还在适配中,但最常用的/review、/investigate、/qa都能正常工作。
1. 它真的在帮你想「为什么」,而不只是「怎么做」
大多数 AI 编程工具是执行者:你说做什么,它就做什么。
gstack 更像是顾问:它会问你为什么要这么做,然后帮你想更好的方案。
比如我让它帮我做一个用户注册功能,它先问了我三个问题:
-
你的用户注册后第一件事是什么? -
你需要验证邮箱吗?为什么? -
用户可以改用户名吗?
这些问题让我重新审视了我的产品设计。
2./review真的能找到问题
我前面说过,/review不是找语法错误,而是找逻辑错误。
我用它审查过三个项目,平均每个项目能发现 2-3 个我没想过的问题。其中一个差点在生产环境造成数据丢失。
3./qa+/browse的组合很实用
Playwright + 真实浏览器 + AI 的组合,比单纯写测试用例要高效得多。
我可以让 AI 自动在浏览器里操作,记录所有API请求和页面变化,找出异常。
1. 命令太多,学习曲线陡
31 个命令,你不可能一次记住。用了一段时间,我还在学习新的命令。
建议不要一次学完,挑几个你最需要的先学:
-
想提高代码质量:先学 /review -
想做产品验证:先学 /plan-ceo-review -
想做 E2E 测试:先学 /qa+/browse
2. 追求完美,容易陷入过度优化
gstack 的标准很高。高到有时候会让你觉得自己的代码哪里都不对。
这种完美主义是双刃剑:用得好能提高质量,用得不好会拖慢进度。
我建议设定一个边界:哪些地方可以妥协,哪些地方必须用 gstack 的标准。
3. OpenCode 适配版有局限
社区适配版功能不如官方版本完整,有些命令还在适配中。如果你需要完整功能,可能还是要用 Claude Code。
gstack 不是万能工具,它有自己的适用场景。
适合用 gstack 的人:
- 创业者/创始人
— 你需要自己做产品决策,但不可能什么都懂。gstack 的产品类命令能帮你想清楚方向 - 全栈开发者
— 你要处理设计、工程、测试、发布。gstack 能帮你补齐各个环节的质量 - 做 toB 产品的开发者
— 安全和文档要求高, /cso和发布类命令很实用 - 对代码质量有追求的人
— 不只是「能跑就行」,而是想做出真正靠谱的产品
不适合用 gstack 的人:
- 只想快速出
MVP的人— gstack 的流程偏重,不适合追求速度的场景 - 新手开发者
— 命令太多,门槛较高,建议先从 OMO 这类简单工具开始 - 小团队的外包项目
— 交付时间紧,用不上这么多质量检查 - 一个人做副业的开发者
— 如果你只是想快速验证想法,用 OMO 会更高效
不要一上来就学所有命令。先挑 3 个:
/review— 帮你审视代码质量 /qa— 帮你做端到端测试 /browse— 帮你操作真实浏览器
这三个命令覆盖了开发中最高频的场景,而且上手难度不高。
如果你做的是自己的产品,加上:
/plan-ceo-review— 帮你审视产品方向 /office-hours— 帮你挑战自己的假设
这两个命令每周用一次就行,不需要天天跑。
如果你需要频繁发布,加上:
/ship— 标准化你的PR创建流程 /land-and-deploy— 自动化发布
用 gstack:
-
重要项目的主分支合并前 -
产品方向不确定的时候 -
发现奇怪 bug 但找不到原因的时候 -
需要做安全审计的时候
不用 gstack:
-
快速实验和验证想法的时候 -
紧急 hotfix 的时候 -
简单的胶水代码(glue code) -
你已经很确定怎么做、只是需要人帮你写的时候
gstack 是一个让你「不是一个人在战斗」的工具。
如果你经常感觉产品开发的各个环节都压在你一个人身上,gstack 能帮你分担。但它不是银弹,它需要你花时间学习,才能真正发挥价值。
- gstack 官方仓库:
- https://github.com/garrytan/gstack
- gstack OpenCode 社区适配版:
- https://github.com/TMFNK/gstack-OpenCode
- Claude Code:
- https://claude.ai/code

