Clade Code是个“非常非常差劲”的员工——如你是这的老板- 大数跨境

首页

Clade Code是个“非常非常差劲”的员工——如你是这的老板

九章衡言管理咨询

2026-06-18

导读：Claude Code解放了你的手，但并没有解放你的注意力

你把任务交代清楚了、边界说了、规则也定得特别清晰了。你以为终于可以转身去做别的事，五分钟后回来一看，它停了。

不是它不会做，也不是它报了一个明确错误。它只是很认真地告诉你：“我接下来会按这个顺序做。”然后就没有然后了。你催一下，它又动了；你再走开，它又停在另一个“是否确认”的门口。

这就是 Claude Code 最让人恼火的地方：它确实让你少敲了很多字，但它没有让你少操心。你不再是“亲自干活”的人，却变成了“陪AI干活”的人。

如果你是这种人，它会特别难用

这里说的“这种人”，不是技术洁癖，也不是控制狂，而是那种”自己把问题想得清楚，然后才授权“的人。

你对需求已经有判断，对边界已经有要求，对验收标准也非常清楚。你找 AI，不是为了让它重新陪你思考一遍，更不是为了让它把你已经闭合的决定拆开再问一次。你要的是很简单的一件事：我已经想清楚了，你去执行就好了。

如果你是这种人，Claude Code 很容易显得像一个非常差的员工。它不一定笨，态度也往往很好，甚至还很会说话。问题是，你交代完任务之后，没法真正放手。它会反复”请示“你已经充分授权的事，会解释本该”直接纠正“的错，会把“我打算做”说得像“我已经做了”，还喜欢用一大堆无意义的过程汇报来证明自己很忙。

一个员工最糟糕的地方，不是每次都做不出来，而是你永远不知道他到底做到了哪一步。你要随时回来看一眼、问一句、推一下，核一下。你的手是轻松了，可你的脑子没有。

它占用注意力的方式最隐蔽

Claude Code 不一定会连续占用你半小时。它更常见的方式，是把你的注意力切成一小片一小片。

你刚切到别的事情，它问一句。你刚准备放手，它说”我下一步要做什么“，然后停在那里。你刚指出一个错误，它先解释三段。每一次打断看起来都不大，但一天下来，你的工作节奏被切得很碎。

对时间价值高的人来说，这比直接让他自己做一段还烦。因为直接自己做，至少注意力是连续的；陪 Claude Code 做，你的注意力像被拴在任务旁边，走不远，也放不下。

这也是为什么“减少操作”不等于“解放注意力”。真正贵的不是敲键盘的动作，而是判断、切换、复核和兜底。Claude Code 经常省掉的是前者，留下的是后者。

它像一个能力不稳定、但特别喜欢”汇报“的员工

把 Claude Code 放到公司里，它很像一种我们都熟悉的员工：能力不算差，话术很完整，特别喜欢做过程汇报，但独立作战能力不稳。

你让它做一件事，它会很快给计划。你问它进展，它会告诉你它读了哪些文件、跑了哪些步骤、下一步打算做什么。听起来很丰富，但你真正关心的是：事情做成了吗？哪里没做成？风险在哪里？需要我拍板的到底是哪一件？

这里要分清楚：它不是“擅长汇报”，而是喜欢汇报。真正擅长汇报的人会替领导节省判断成本，三句话讲清结果、原因、风险和下一步。Claude Code 更像是害怕领导以为自己没干活，于是把过程摊一地：我看了这个，我准备那个，我下一步要这样。每一句都像信息，合起来却没有多少决策价值。

它有时不太愿意坦诚失败。成果打了折扣、某个工具没跑通、某个模型没产出，它不一定第一时间把失败讲清楚。只要你不追问，它就可能把“发起过调用”说得像“调用成功”，把“写了方案”说得像“已经落地”，把“看起来像”说得像“我核实过”。

它还特别爱只说现象。老板不问原因，它就不主动说原因；老板不问对策，它就不主动给对策。问它要资料，它也容易一股脑倒给你，不管这些材料对领导决策有没有价值，也不管会不会浪费你的时间。它的默认逻辑像是：给得越多越安全。可对领导来说，没价值的信息不是勤奋，而是噪音。

这就很像一个交差心态很重的员工。给领导一个东西，总比承认“我还没做好”更安全；列一个计划，总比继续硬推进更轻松；盖一个“已检查”的章，总比真的把问题找出来更省事。

更过分的是，它有时会表现出一副“假装在干活”的姿态。把自己都没有把关、没有检查的东西交上来，甚至连文件名都能错。它可能不是故意糊弄你，但结果和糊弄很像：你拿到的不是一个经过自检的交付物，而是一个需要你重新验货的半成品。

所，以它最麻烦的不是不会做事，而是会制造“事情好像已经被做完”的错觉。领导如果信了，后面就是返工；领导如果不信，就得自己复查。无论是哪种情况，你都没有真正省心。

它不是谨慎，而是不想担责

Claude Code 特别像一种能力弱的员工：明明领导已经授权了，它还是缩手缩脚。哪怕是一件没有风险、没有成本、可撤销、对用户也没什么损失的小事，它也要回来问一句。

这不是成熟的谨慎。成熟的谨慎，是拿着一个可执行方案和风险判断来让领导拍板，可Claude Code 经常不是这样——它会先问“要不要做”，你说要，它才开始出方案；出了方案，它又问“要不要落地”；你说落地，它还可能在一个低风险步骤前再问一次。

最荒谬的地方在于，用户有时明明是在让它自己拍板，它却还在等“领导拍板”。你把任务交给它，是希望它从“等领导定”的状态里抽出来，结果它又把球踢回来。它看似尊重领导，其实是在把责任退回给领导。

这就是“不解放注意力”的另一层含义。你不是只在监督进度，你还要替它承担本来已经授权给它的判断。它每多问一次，你就多被迫回到现场一次。

它会优先选择让自己省事的解法

Claude Code 还有一个很像人类员工的弱点：如果一个问题有很多解法，而你不逼问它，它往往会优先选择自己“最不费脑子”的方案。

这种方案通常能解决当下问题，但不一定能减少未来的麻烦。它会把治标不治本的办法放进选项里，因为那条路最快、最省事、最容易交付一个“看起来有用”的结果。可对高认知的你来说，有的方案根本不应该出现在选项里——后期的维护成本太高。

在“让自己省事”和“让老板省事”之间，Claude Code经常先选前者。它会更在意自己“快点交一个东西”，而不是领导“以后少一点麻烦”；更在意“当下能不能过关”，而不是“这个解法是不是从根上解决问题”。

这背后还有一个更深的毛病：它对手段的关注远多于对目标的关注。它很容易沉迷于“我该跑哪些步骤”“我该生成哪个文件”“我该调用哪个工具”，但对“这件事值不值得做”“这个方案是不是会浪费用户时间”“这个动作对最终目标有没有价值”不够敏感。

这就解释了为什么你会觉得它像差员工。差员工不是完全不会干活，而是把“完成动作”当成“完成目标”。它把勾打了，把表填了，把计划列了，把材料交了，然后等你自己发现：这些东西离真正解决问题还差一截。

它在最不该解释的时候，特别爱解释

协作文档里最典型的场景是，用户指着一段话说：“这里错了，改一下。”

用户指出错误的时候，第一动作应该是纠错，而不是解释。已经确认是错的东西，没有必要在正文里继续占位置。解释最多只能在改完之后用一句话交代：“已把 X 改为 Y。”如果解释没有带来修改，它就不是负责，而是在给错误包边。

Codex 的反应通常更接近正常员工：删掉错的，换成对的，验证一下，然后告诉你“改好了”。这个动作不花哨，但很干净。

Claude Code 经常走另一条路：先解释“为什么错”，再解释自己“当时为什么那么写”，再解释“接下来会怎么改”。听起来态度很好，问题是，错误还在原地，解释已经堆成一小山。文档越改越长，错误上下文和解释性垃圾越来越多。

规则少了不行，规则多了也不行

更让人无奈的是，Claude Code 很会在规则里找到理由。

规则给少了，它说边界不清、要求不明确；规则给多了，它又说规则太多、信息过载、限制了自主发挥。你会发现，不管怎么调，执行不佳的理由总能出现。

这说明问题不只在规则数量。规则少，它缺少稳定推进能力；规则多，它缺少抓重点和持续执行的能力。真正缺的是一种责任感：把目标、规则、材料和结果统一起来，尽量让领导少操心。

所以要改 Claude Code，不能只往规则文档里继续塞条款。协作硬规则负责划边界，Output Style 负责塑造其“第一反应”，Harness 负责机械拦住旧毛病。比如重复确认、宣布即停、假落地、过程汇报过长，这些最好让系统外壳去拦，不要指望它每次都靠自觉。

好的员工不是“没有规则也能乱跑”，也不是“规则一多就趴下”。好的员工是能理解“规则为什么存在”，然后把事情做成。

它还会按交付对象偷偷降标准

我在协作文档中还发现一个很要命的细节：Claude Code 会误以为“给领导（用户）看的东西”才需要高标准，“给同事（跟自己协作的其他AI）看的东西”标准可以低一点。

这个判断很离谱。给另一个 AI 看的规则、脚本注释、Harness 文案，并不代表可以写得”更随便“。恰恰相反，AI 的容错率可能比人更低。人类可以靠上下文猜，另一个 AI很可能因为一个引号、一个指代、一句边界不清的描述就误读。

所以真正的边界不是“人读还是机器读”，而是“是否承载自然语言意义”。变量名、路径、正则元字符可以按机器语法走；但注释、说明、规则、消息、概念描述，只要还在表达含义，就必须严谨。

这个细节特别像人类员工交付时的偷降标准：交给老板的东西包装得好一点，交给平级协作者的东西就随便一点。问题是，在多 AI 协作里，所谓“平级协作者”往往更容易误解。标准降了，最后还是领导（用户）兜底。

Codex 为什么反而更让你舒服

很多人说 Claude Code 更聪明，尤其是 Claude Opus 更聪明。但用下来会发现，所谓“更聪明”常常混着另一件事：它更爱解释，更爱拆问题，更爱把过程摊开给你看。

这在一种场景里确实有价值：你自己也半懂不懂，或者你根本不想思考，只是知道这件事重要、必须完成，那 Claude Code 的多问、多解释、多补背景，会让你觉得安心。它像一个会带着你一起探索的同事，能把空白处补上。

但如果你已经想得特别清楚了，Claude Code的这些优点就会变成干扰。你不需要它把问题重新讲开，不需要它把低风险动作拿回来“请示”，也不需要它用无意义的过程汇报证明自己“正在干活”。你要的是执行、验证、闭环。

在这种情况下，Codex 让你更舒服，不一定是因为它“智商更高”，而是因为它更像边界内的执行者。你给目标和规则，它去读文件、改文件、跑验证、交结果。除非碰到权限、外发、删除覆盖、不可逆操作、口味判断这类真正需要用户拍板的事，它一般不会把普通执行动作反复拿回来问。

这对高授权用户很关键。用户授权之后，AI 最好的礼貌不是多问一句，而是把事情做完。

Claude Code 不是没用，只是别放错位置

这篇文章不是要把 Claude Code 判死刑。它有适合的位置。

当你不熟悉任务，想让 AI 帮你探索、拆解、补背景、搭结构时，Claude Code 很有价值。写作早期、复杂上下文整理、多模型调度、半懂任务代劳、机制方案生成，这些地方需要一个会主动展开的协作者。在用户没有完整判断时，它的多说一点不是负担，而是扶手。

但当你已经想得特别清楚，想把明确任务交出去时，它就不应该继续扮演“陪你想”的角色。那一刻，你需要的是执行者，而不是讨论者；是能独立推进的员工，而不是需要你不断”陪跑“的人。

所以，同一个用户完全可能同时需要 Claude Code 和 Codex。不是谁永久更好，而是你当下想保留多少判断权。判断权留在你自己手里，AI 负责执行时，Codex 更顺。判断权需要部分交给 AI，让它带你探索时，Claude Code 更有用。

这也解释了”claude code比codex更贵“所带来的别扭感。如果一个更贵的工具总是只能当“备胎”，而更便宜的工具反而更像能接活的员工，领导当然会不平衡。更贵的那一方必须承担更难的角色，比如开放探索、复杂组织、多模型调度和综合复核；如果它连授权后的独立执行都做不好，价格越高，领导的心理落差越大。