大数跨境

顶尖 AI 工程师已经不再写 Prompt 了!Claude Code 负责人自曝:我只设计能自己跑起来的循环,关掉电脑它还在干活

顶尖 AI 工程师已经不再写 Prompt 了!Claude Code 负责人自曝:我只设计能自己跑起来的循环,关掉电脑它还在干活 机器回廊
2026-06-19
18
导读:顶尖 AI 工程师已经不再写 Prompt 了!Claude Code 负责人自曝:我只设计能自己跑起来的循环,关掉电脑它还在干活

2026 年 6 月 8 日,一条极短的推文在 X 上炸开了锅。

发帖人是 OpenClaw 创建者 Peter Steinberger。话很短,但每一句都像锤子砸在工程师的肌肉记忆上:

"Here's your monthly reminder that you shouldn't be prompting coding agents anymore. You should be designing loops that prompt your agents."

「每月提醒一次:你不应该再直接给 coding agent 下 prompt 了。你应该设计循环,让循环去 prompt 你的 agent。」

这条帖子的数据说明了一切:近2000 万浏览,近 2 万人点赞,1.4 万人收藏

评论区里,一线工程师的反应出奇地一致——几乎没人反驳,清一色是「对,我已经这么干了」。

▲ Peter Steinberger 推文:“每月提醒一次——你不该再给 coding agent 写 prompt 了。你应该设计循环,让循环去 prompt 你的 agent。”(近 2000 万浏览,近 2 万点赞)

一、从“聊天框”到“控制系统”:一场静默的范式转移

如果你还在精心构造 prompt、一轮一轮地对着 Claude 或 ChatGPT 打字,那你要注意了——这正是这波变革要淘汰的工作方式。

几天后,安全研究员 @0x0SojalSec 发了一条更直白的总结帖:

"Stop making prompts. Start designing loops. Loop engineering is the new meta."

「别再写 prompt 了。开始设计循环。Loop engineering 正在成为新范式。」

他直接点名 Anthropic Claude Code 负责人 Boris Cherny,并甩出了一张清单——每个有效 AI Agent 循环的 6 个关键组件

  1. Automations
    (自动化触发器,不需要你手动触发)
  2. Memory files
    (STATE.md,跨运行持久化记忆)
  3. Worktrees
    (隔离环境,避免 agent 之间互相踩踏)
  4. Skills & sub-agents
    (可复用技能 + 子代理分工)
  5. Evaluator-optimizer pattern
    (写手 vs 检查者,分离执行与验证)
  6. Hard stop conditions
    (硬停止条件,不是 AI 自己说“我做完了”就行)

▲ @0x0SojalSec 总结帖,明确提出“Loop engineering is the new meta”并列出 6 个核心构建块

Mike(@mikenevermiss)紧接着发了一篇长文,把这件事讲得很透。他的核心论证直接得令人生畏:

"The agent forgets everything between runs. The loop does not. That single fact is the entire architecture."

「Agent 在每次运行之间会忘记一切。Loop 不会。这 14 个字,就是整个架构的根基。」

这句话不是一个比喻。它是工程事实。

Claude、GPT、Grok——无论哪个模型,每次新的 API 调用都是“失忆”的。上下文窗口再大,也有边界。但 loop 不一样:loop 把进度、决策、状态写进了磁盘文件(STATE.md、CLAUDE.md),每次新运行,agent 先读文件、再干活、再写回。记忆不靠模型,它靠的是文件系统

这就是旧范式与新范式的根本分界线。

过去两年,你学的是 prompt engineering:怎么措辞、怎么加 few-shot、怎么 chain-of-thought。现在,杠杆点移了。你该学的是怎么设计一个自己发现自己干活、自己验证自己产出的控制循环。

二、拆开看:6 个组件怎么把一个人变成一支军队

别被“6 个组件”吓到。它们各自解决的问题,只要用过 coding agent 超过一周,你都撞过。

1. Automations——心跳

没人手动触发,loop 凭什么自己跑起来?

答案是 cron、GitHub Actions、/loop、hooks。每天早 8 点自动跑一遍 CI 失败分析、昨晚提交摘要、未分类 issue 扫描。你起床时,loop 已经把今天的待办列好了。

这不是“省了 5 分钟”,这是把启动成本降到了零

2. Memory / STATE.md——脊柱

这是最不起眼、也最关键的一环。

一个典型的 STATE.md 只有三样:上次做了什么、目前在做什么、阻塞在哪里。就这么短。但它让 agent 从“每次从零开始”变成了“接着上次往下干”。

Boris 团队的 CLAUDE.md 更进一步:项目级文件直接放进 git 仓库,任何人在 PR 里 @ 更新规则。他把这叫compounding engineering——规则越写越厚,loop 越跑越稳。

3. Worktrees——隔间

两个 agent 同时改同一个文件,冲突、覆盖、回滚——用过就知道疼。

git worktree add给每个 agent 一个独立 checkout,共享 git 历史但互不干扰。Claude Code 原生支持--worktreeisolation: worktree

Boris 的真实配置:每天同时开 5 个终端 Claude + 5-10 个 claude.ai 会话,每个跑在独立的 worktree 上。没有隔离,这个规模一秒钟就崩。

▲ Boris 的真实工作流被粉丝整理成网站(howborisusesclaudecode.com),展示了同时运行 5+ Claude、git worktree 隔离、CLAUDE.md 共享等细节

4. Skills + Sub-agents——可复用的兵种

Skill 就是“写一次、永远复用”的操作手册——一个 SKILL.md 加精炼脚本,遇到同类任务直接调。

Sub-agent 是把大任务拆给不同角色:explorer 负责搜索、implementer 负责写代码、verifier 负责检查。Boris 强烈建议把常见流程写成.claude/agents/*.md,给不同 sub-agent 配独立 worktree。

5. Evaluator-Optimizer——裁判和选手分开

一个 agent 给自己打分?永远太松了。“自己判自己的作业”是所有 AI agent 的软肋。

正确做法:一个 agent 写,另一个独立 agent(甚至不同模型)按客观标准检查——测试全绿、lint 通过、页面在真实浏览器里能点、后端数据库状态正确。失败就回环,直到条件满足。

Boris 在自己的推文里把这一点提到了最高优先级:

"We talk a lot about how important it is to set up self-verification loops... self-verification is a key ingredient that enables the model to run for much longer, delivering a result that is closer to what you intended."

「我们反复讨论设置自我验证循环有多重要……自我验证是让模型跑得更久、产出更接近你意图的关键配料。」

▲ Boris Cherny 本人推文,强调自我验证循环是长时间自主运行的关键

6. Hard Stop Conditions——铁门

社区里出现了一个著名的反模式,叫Ralph Wiggum loop(由 Geoffrey Huntley 命名):agent 还没干完就说“完成了”,loop 就退出了。跟动画片里 Ralph 那句经典台词一样——“I'm helping!”

停止条件不能靠 AI 自己说“完成了”。你得给它可验证的外部事实:npm test全绿、Linear ticket 移到 Done 且 CI 通过、页面交互正常。再加一个最大迭代次数做最后一道保险。

三、Addy Osmani:给这个新范式正式命名的人

Google 工程师 Addy Osmani 在 6 月 7 日发了一篇博客,标题就是「Loop Engineering」。

这是在社区话语被 Boris 和 Peter 的推文搅热之后,第一次有人用工程文档的精度把这件事拆干净。

他的核心观点只有一行表,但这一行表比任何煽动性推文都更有杀伤力:他把 Codex 和 Claude Code 的实现一一对齐,证明“loop shape 正在变得工具无关”——

原语
Codex
Claude Code
Automations
Automations tab + /goal
/loop, /goal, hooks, GitHub Actions
Worktrees
内置 per thread
git worktree + --worktree
Skills
SKILL.md
SKILL.md / CLAUDE.md
Connectors
MCP + plugins
MCP servers + plugins
Sub-agents
.codex/agents/ TOML
.claude/agents/ + teams
State
Markdown / Linear
Markdown / Linear via MCP

▲ Addy Osmani 的系统框架对比,证明 loop 原语正在跨平台标准化

但 Addy 真正厉害的地方不在于这张表。他在博客里写了四句让行家坐不住的话:

  • “Verification is still on you.”
    ——验证还是你的事。loop 跑得再顺,你得看懂它产出。
  • “Comprehension debt grows faster.”
    ——理解债务比技术债务涨得快。代码不是你写的,但你得能改。
  • “Cognitive surrender is the comfortable trap.”
    ——认知投降是最舒服的陷阱。“按下 go 就行”的姿势,也是最危险的。
  • “Two people can build the exact same loop and get completely opposite results.”
    ——两个人搭出一模一样的 loop,结果可以完全相反。loop 不分好坏,是你分。

整篇博客真正的落点在最后一句:

"Build the loop. But build it like someone who intends to stay the engineer, not just the person who presses go."

「去搭你的 loop。但你搭它的姿势,得是一个还想继续当工程师的人——不是那个只会按开始键的人。」

四、GitHub 上已经能 clone 了:Cobus 把 loop 做成了开源基础设施

理论讲到这里,有人会问:我现在能上手吗?

能。

南非工程师 Cobus Greyling 在 GitHub 上建了一个仓库——cobusgreyling/loop-engineering——它直接就是生产级模板:

  • 三个 CLI 工具:loop-init(一键初始化)、loop-audit(成本审计)、loop-cost(精确计价)
  • 7 个可直接 clone 的 loop 模式:daily-triage(每日分类)、PR-babysitter(PR 保姆)、CI-sweeper(CI 扫雷)、changelog-drafter(变更日志起草)……
  • 每个模板自带 STATE.md、AGENTS.md、skills/ 目录
  • 明确分了三级:L1(只报告不动手)、L2(辅助修复)、L3(无人值守)

▲ cobusgreyling/loop-engineering:开源的生产级 loop 模式仓库,提供 CLI 工具、STATE.md 模板和三级自主度阶梯

更有意思的是,Cobus 把 Grok、Claude Code、Codex 的对应能力做了完整映射——结论是,loop 的形态正在变得工具无关。你换平台只用换底层指令,loop 的结构不变。

这会催生什么?一个跨平台的 loop 市场。你卖的东西不再是代码本身,而是 loop 设计。就像过去卖 SaaS 模板、卖 DevOps pipeline——loop 正在变成可交易的生产力资产。

五、跑 loop 的代价:Boris 的诚实

但话不能说一半。

所有认真讨论 loop engineering 的人,都在同一处刹车:这不轻松,也不便宜。

Boris 自己承认,一个设计不当的 loop 跑一夜就是巨额 token 账单。Mike 的建议很实操:先手动跑 3-5 次测单次成本,再乘以迭代上限,看一眼总价再决定要不要放它通宵。

钱只是第一道槛。真正会出事的是人。

Addy 警告了一圈:loop 跑得越顺,你越容易不看它产出的代码。这叫 comprehension debt——理解债务。代码不是你一行一行写的,但线上出了 bug,你要负责。你不会读的代码,跟你的资产没有关系——它就是定时炸弹。

认知投降(Cognitive Surrender)是所有陷阱里最深的一个:你搭了一个完美的 loop,每天按 go,看它跑、看它绿、看它合。三个月后有人问你这套系统为什么这样设计,你只能说“loop 定的”。那一刻,你不是工程师了。你是 loop 的操作员。

Boris 自己也说了一句很有信息量的话:loops 是“他们十年后仍然最骄傲的功能”——这句话的另一面是,现在还远远没到终态。共享内存怎么搞、质量怎么追踪、停止条件怎么跟真实业务结果绑定——这些全是前沿难题。

六、它到底是什么,比它叫什么更重要

Loop engineering 这个叫法,是社区在 6 月这波集中讨论里自然凝结出来的。但名称不重要。重要的是你从它里面看到了什么。

你看到的是“更高级的 prompt 技巧”,那你还在旧范式里。

你看到的是一个控制系统——有信号输入(automations)、有状态存储(memory files)、有并行隔离(worktrees)、有分工协作(skills + sub-agents)、有反馈校正(evaluator-optimizer)、有边界条件(hard stop)——那你已经在用新范式思考了。

Peter Steinberger 说的「杠杆点已经移动」就是这个意思。你以前花 90% 时间写 prompt,10% 时间看结果。现在你把 prompt 外包给 loop,花 90% 时间设计系统、定义验证门、review 输出、更新记忆文件。

你不再是打字的人。你是设计打字系统的人。

Boris Cherny 亲口证实,他的日常工作已经从“坐在聊天框前”变成了:设计心跳、维护 STATE.md、调整隔离策略、写好验证规则,然后 review loop 吐出来的东西。

这解释了为什么有些工程师用 AI 越用越快,有些人越用越迷茫。工具都一样。真正拉开差距的,是你把自己放在系统的哪一层

【声明】内容源于网络
0
0
机器回廊
机器回廊
内容 69
粉丝 0
机器回廊 机器回廊
总阅读222
粉丝0
内容69