大数跨境

gstack:YC CEO开源的AI虚拟工程团队

gstack:YC CEO开源的AI虚拟工程团队 创见AI实验室
2026-04-02
0
导读:一个 CEO 帮你看产品方向,一个设计师帮你审设计,一个工程经理帮你管代码质量,一个 QA 帮你跑测试,还有一个安全工程师帮你检查漏洞。
31个命令,覆盖CEO、设计、工程、QA、安全、发布全流程

你有没有遇到过这种情况:

产品做到一半,突然觉得哪里不对。设计上好像有缺陷,工程上可能有 bug,安全上可能有问题,发布流程也是一团糟。你看着屏幕,不知道该从哪里下手。

这时候你最想要什么?

一个 CEO 帮你看产品方向,一个设计师帮你审设计,一个工程经理帮你管代码质量,一个QA帮你跑测试,还有一个安全工程师帮你检查漏洞。

问题是:你请得起这些人吗?

Garry Tan 请得起。他是 YC(Y Combinator)的 CEO,全球最顶级孵化器的掌门人。但他做的不是招聘这些人,而是把这些人「做」成了 AI 工具

这个工具叫gstack

gstack 是什么

gstack 是 GarryTan在 2025 年开源的一个 AI 编程辅助工具,目前在GitHub上有 61.6k star(数据截止 2026-04-02 20:49)。

它的官方定义是:

23 opinionated tools that serve as CEO, Designer, Eng Manager, Release Manager, Doc Engineer, andQA.

翻译成人话就是:它不是一个人在帮你写代码,而是一整个工程团队在帮你。

这个团队的成员包括:

  • CEO
    — 帮你审视产品方向
  • Designer
    — 帮你处理设计系统
  • Eng Manager
    — 帮你管代码质量和发布流程
  • Release Manager
    — 帮你发布和部署
  • Doc Engineer
    — 帮你写文档
  • QA— 帮你做端到端测试

31 个命令,分成几大类,覆盖了产品开发的各个角落。

31 个命令,实际能干什么

我知道 31 个命令听起来很多。但其实你可以分批学,先挑最常用的入手。

产品方向类

如果你经常做到一半才发现产品方向有问题,这类命令能帮你提前发现问题。

命令
功能
/plan-ceo-review
CEO 视角审视你的产品想法,从市场、竞争、用户价值角度挑毛病
/office-hours
模拟 YC 合伙人的产品挑战,像是在接受创业导师的质询

我第一次用/plan-ceo-review的时候,它问我:「你的用户是谁?他们为什么不用竞品?」

我愣住了。我的产品定位其实没有我想的那么清晰。

这类命令的价值不是给你答案,而是帮你发现自己没想过的问题。

设计系统类
命令
功能
/design-consultation
从零开始帮你构建设计系统,色彩、字体、间距、组件库
/design-review
对现有设计做 80 项质量审计,找出视觉上不规范的地方

说实话,这类命令我用的不多。因为我的设计基本靠 Tailwind + shadcn/ui,自己不需要从零搭设计系统。

但如果你在做一个需要独特视觉风格的产品,/design-consultation能帮你省不少时间。

代码质量类

这类命令是 gstack 的核心,也是我使用频率最高的。

命令
功能
/review
找那些通过测试但会在生产环境爆雷的 bug,不是语法错误,是逻辑错误。内置自动修复功能(明显的 bug 会自动修复)
/investigate
系统化调试,帮你找复杂 Bug 的根本原因。遵循"不调查清楚不修复"原则

/review是我最喜欢的命令。

它的逻辑不是「你的代码有没有错」,而是「你的代码在什么场景下会出错」。

它会模拟各种边界条件:并发请求、空数据、网络超时、极端用户输入……然后告诉你你的代码在这些情况下会怎么表现。

而且它会自动修复那些明显的 bug(死代码、N+1 查询等),但对真正复杂的问题(安全、并发、设计决策)会停下来问你。

用过之后我才发现,我的代码在并发场景下有race condition。这种问题在本地测试几乎不可能发现。

安全审计类
命令
功能
/cso
OWASP + STRIDE 安全审计,检查注入、认证、敏感数据等常见漏洞

/cso我只在重要项目上用。不是每个小工具都需要安全审计,但如果你在做支付、用户数据、登录认证这类功能,花 10 分钟跑一下/cso很值得。

发布和部署类
命令
功能
/ship
同步代码 + 运行测试 + 创建 PR
/land-and-deploy
合并 PR + 部署 + 验证
/canary
发布后监控,监控控制台错误、性能回退、页面故障
/benchmark
性能基准测试,测量页面加载时间、Core Web Vitals

这些命令把整个发布流程自动化了。

以前我的发布流程是:本地测试 →push→ 等CI→ 创建PR→ 等审查 → 合并 → 等部署 → 手动验证。

用 gstack 的话,一个/land-and-deploy就搞定了。它会等CI通过,等审查通过,然后自动合并和部署。

浏览器和集成类
命令
功能
/browse
给 AI 装上眼睛,可以真实操作浏览器
/codex
让 OpenAI Codex 做第二审查

/browse是个很有意思的命令。它不是简单的网页爬虫,而是真正的浏览器操作:点击、填表、滚动、截图。

配合/qa使用,你可以让 AI 在真实浏览器里跑完整的 E2E 测试。

/codex则是让另一个 AI 来审查你的代码。两个不同的 AI 模型,视角不同,能发现的问题也不同。

和 OpenCode 原生工具的对比

我猜你更关心的是:这个工具在 OpenCode 里能不能用?

答案是:官方版本不支持 OpenCode。

gstack 官方版本只支持 Claude Code。GarryTan开发这个工具的时候,瞄的就是 Claude Code 的工具调用能力。

但是,社区有人做了适配版本:TMFNK/gstack-OpenCode

这个社区版本把 gstack 的核心功能适配到了 OpenCode 上。虽然功能可能没有官方版本那么完整,但核心命令基本都能跑。

如果你想用 gstack,有两个选择:

  • 用 Claude Code
    — 完整支持,但需要订阅 Claude
  • 用 OpenCode + 社区适配版
    — 功能基本够用,免费

我目前用的是第二个方案。社区适配版有一些命令还在适配中,但最常用的/review/investigate/qa都能正常工作。

我使用 gstack 的真实感受
好的地方

1. 它真的在帮你想「为什么」,而不只是「怎么做」

大多数 AI 编程工具是执行者:你说做什么,它就做什么。

gstack 更像是顾问:它会问你为什么要这么做,然后帮你想更好的方案。

比如我让它帮我做一个用户注册功能,它先问了我三个问题:

  • 你的用户注册后第一件事是什么?
  • 你需要验证邮箱吗?为什么?
  • 用户可以改用户名吗?

这些问题让我重新审视了我的产品设计。

2./review真的能找到问题

我前面说过,/review不是找语法错误,而是找逻辑错误。

我用它审查过三个项目,平均每个项目能发现 2-3 个我没想过的问题。其中一个差点在生产环境造成数据丢失。

3./qa+/browse的组合很实用

Playwright + 真实浏览器 + AI 的组合,比单纯写测试用例要高效得多。

我可以让 AI 自动在浏览器里操作,记录所有API请求和页面变化,找出异常。

不好的地方

1. 命令太多,学习曲线

31 个命令,你不可能一次记住。用了一段时间,我还在学习新的命令。

建议不要一次学完,挑几个你最需要的先学:

  • 想提高代码质量:先学/review
  • 想做产品验证:先学/plan-ceo-review
  • 想做 E2E 测试:先学/qa+/browse

2. 追求完美,容易陷入过度优化

gstack 的标准很高。高到有时候会让你觉得自己的代码哪里都不对。

这种完美主义是双刃剑:用得好能提高质量,用得不好会拖慢进度。

我建议设定一个边界:哪些地方可以妥协,哪些地方必须用 gstack 的标准。

3. OpenCode 适配版有局限

社区适配版功能不如官方版本完整,有些命令还在适配中。如果你需要完整功能,可能还是要用 Claude Code。

适合谁用

gstack 不是万能工具,它有自己的适用场景。

适合用 gstack 的人:

  • 创业者/创始人
    — 你需要自己做产品决策,但不可能什么都懂。gstack 的产品类命令能帮你想清楚方向
  • 全栈开发者
    — 你要处理设计、工程、测试、发布。gstack 能帮你补齐各个环节的质量
  • 做 toB 产品的开发者
    — 安全和文档要求高,/cso和发布类命令很实用
  • 对代码质量有追求的人
    — 不只是「能跑就行」,而是想做出真正靠谱的产品

不适合用 gstack 的人:

  • 只想快速出
    MVP的人— gstack 的流程偏重,不适合追求速度的场景
  • 新手开发者
    — 命令太多,门槛较高,建议先从 OMO 这类简单工具开始
  • 小团队的外包项目
    — 交付时间紧,用不上这么多质量检查
  • 一个人做副业的开发者
    — 如果你只是想快速验证想法,用 OMO 会更高效
我的使用建议
第一阶段:先跑通核心流程(1-2 天)

不要一上来就学所有命令。先挑 3 个:

  • /review
    — 帮你审视代码质量
  • /qa
    — 帮你做端到端测试
  • /browse
    — 帮你操作真实浏览器

这三个命令覆盖了开发中最高频的场景,而且上手难度不高。

第二阶段:补充产品思维(1 周)

如果你做的是自己的产品,加上:

  • /plan-ceo-review
    — 帮你审视产品方向
  • /office-hours
    — 帮你挑战自己的假设

这两个命令每周用一次就行,不需要天天跑。

第三阶段:完善发布流程(根据需要)

如果你需要频繁发布,加上:

  • /ship
    — 标准化你的PR创建流程
  • /land-and-deploy
    — 自动化发布
什么时候用,什么时候不用

用 gstack:

  • 重要项目的主分支合并前
  • 产品方向不确定的时候
  • 发现奇怪 bug 但找不到原因的时候
  • 需要做安全审计的时候

不用 gstack:

  • 快速实验和验证想法的时候
  • 紧急 hotfix 的时候
  • 简单的胶水代码(glue code)
  • 你已经很确定怎么做、只是需要人帮你写的时候
一句话总结

gstack 是一个让你「不是一个人在战斗」的工具。

如果你经常感觉产品开发的各个环节都压在你一个人身上,gstack 能帮你分担。但它不是银弹,它需要你花时间学习,才能真正发挥价值。

参考资料
  • gstack 官方仓库:
    • https://github.com/garrytan/gstack
  • gstack OpenCode 社区适配版:
    • https://github.com/TMFNK/gstack-OpenCode
  • Claude Code:
    • https://claude.ai/code
    OpenCode系列精选
    OpenCode铁三角选型指南,你真的需要全装吗?
    OpenCode Day24:AI能看懂代码了?LSP才是幕后功臣
    OpenCode铁三角:OpenSpec + Superpowers + OMO,从“随意编码”到“规范开发”的完整指南
    OpenCode Day22:OpenSpec 与 OPSX 完整教程:从入门到实战
    Opencode Day21:OpenCode+Playwright,让AI做测试
    Opencode Day20:干货必看!我用这套组合拳零手写代码上线小程序(附全流程)
    Opencode Day19:有了Superpowers,我的OpenCode终于不“乱写”了
    Opencode Day18:MiniMax出Skills了:前端、后端、安卓、iOS,一套技能全搞定
    同一套Skill,要在OpenCode、Claude Code、Codex、Cursor里各配一遍?这个工具治好了我的精神内耗
    OpenCode Day16:效率翻倍!我用两个月总结的实战小技巧
    OpenCode Day15:实战必看!3小时给娃做了个“早餐小铺”,再也不愁明天吃啥
    OpenCode Day14:干货!让AI走流程,不瞎干,效率翻倍
    Impeccable实战:OpenCode+自然语言,你只要会说话就能写出专业界面
    OpenCode Day12:手把手教你开发第一个自定义插件(从0到发布)
    OpenCode Day11:5个让OpenCode记住一切的Memory插件
    OpenCode Day10:Skills才是真正的效率核弹,让AI学会替你干活
    开发者必看!这7个OpenCode插件,让你的编码效率原地起飞(附完整配置)

    【声明】内容源于网络
    0
    0
    创见AI实验室
    创见AI实验室,我们不只是介绍工具,我们共同创造工作方式的未来。
    内容 147
    粉丝 0
    创见AI实验室 创见AI实验室,我们不只是介绍工具,我们共同创造工作方式的未来。
    总阅读20
    粉丝0
    内容147