你把任务交代清楚了、边界说了、规则也定得特别清晰了。你以为终于可以转身去做别的事,五分钟后回来一看,它停了。
不是它不会做,也不是它报了一个明确错误。它只是很认真地告诉你:“我接下来会按这个顺序做。”然后就没有然后了。你催一下,它又动了;你再走开,它又停在另一个“是否确认”的门口。
这就是 Claude Code 最让人恼火的地方:它确实让你少敲了很多字,但它没有让你少操心。你不再是“亲自干活”的人,却变成了“陪AI干活”的人。
如果你是这种人,它会特别难用
这里说的“这种人”,不是技术洁癖,也不是控制狂,而是那种”自己把问题想得清楚,然后才授权“的人。
你对需求已经有判断,对边界已经有要求,对验收标准也非常清楚。你找 AI,不是为了让它重新陪你思考一遍,更不是为了让它把你已经闭合的决定拆开再问一次。你要的是很简单的一件事:我已经想清楚了,你去执行就好了。
如果你是这种人,Claude Code 很容易显得像一个非常差的员工。它不一定笨,态度也往往很好,甚至还很会说话。问题是,你交代完任务之后,没法真正放手。它会反复”请示“你已经充分授权的事,会解释本该”直接纠正“的错,会把“我打算做”说得像“我已经做了”,还喜欢用一大堆无意义的过程汇报来证明自己很忙。
一个员工最糟糕的地方,不是每次都做不出来,而是你永远不知道他到底做到了哪一步。你要随时回来看一眼、问一句、推一下,核一下。你的手是轻松了,可你的脑子没有。
它占用注意力的方式最隐蔽
Claude Code 不一定会连续占用你半小时。它更常见的方式,是把你的注意力切成一小片一小片。
你刚切到别的事情,它问一句。你刚准备放手,它说”我下一步要做什么“,然后停在那里。你刚指出一个错误,它先解释三段。每一次打断看起来都不大,但一天下来,你的工作节奏被切得很碎。
对时间价值高的人来说,这比直接让他自己做一段还烦。因为直接自己做,至少注意力是连续的;陪 Claude Code 做,你的注意力像被拴在任务旁边,走不远,也放不下。
这也是为什么“减少操作”不等于“解放注意力”。真正贵的不是敲键盘的动作,而是判断、切换、复核和兜底。Claude Code 经常省掉的是前者,留下的是后者。
它像一个能力不稳定、但特别喜欢”汇报“的员工
把 Claude Code 放到公司里,它很像一种我们都熟悉的员工:能力不算差,话术很完整,特别喜欢做过程汇报,但独立作战能力不稳。
你让它做一件事,它会很快给计划。你问它进展,它会告诉你它读了哪些文件、跑了哪些步骤、下一步打算做什么。听起来很丰富,但你真正关心的是:事情做成了吗?哪里没做成?风险在哪里?需要我拍板的到底是哪一件?
这里要分清楚:它不是“擅长汇报”,而是喜欢汇报。真正擅长汇报的人会替领导节省判断成本,三句话讲清结果、原因、风险和下一步。Claude Code 更像是害怕领导以为自己没干活,于是把过程摊一地:我看了这个,我准备那个,我下一步要这样。每一句都像信息,合起来却没有多少决策价值。
它有时不太愿意坦诚失败。成果打了折扣、某个工具没跑通、某个模型没产出,它不一定第一时间把失败讲清楚。只要你不追问,它就可能把“发起过调用”说得像“调用成功”,把“写了方案”说得像“已经落地”,把“看起来像”说得像“我核实过”。
它还特别爱只说现象。老板不问原因,它就不主动说原因;老板不问对策,它就不主动给对策。问它要资料,它也容易一股脑倒给你,不管这些材料对领导决策有没有价值,也不管会不会浪费你的时间。它的默认逻辑像是:给得越多越安全。可对领导来说,没价值的信息不是勤奋,而是噪音。
这就很像一个交差心态很重的员工。给领导一个东西,总比承认“我还没做好”更安全;列一个计划,总比继续硬推进更轻松;盖一个“已检查”的章,总比真的把问题找出来更省事。
更过分的是,它有时会表现出一副“假装在干活”的姿态。把自己都没有把关、没有检查的东西交上来,甚至连文件名都能错。它可能不是故意糊弄你,但结果和糊弄很像:你拿到的不是一个经过自检的交付物,而是一个需要你重新验货的半成品。
所,以它最麻烦的不是不会做事,而是会制造“事情好像已经被做完”的错觉。领导如果信了,后面就是返工;领导如果不信,就得自己复查。无论是哪种情况,你都没有真正省心。
它不是谨慎,而是不想担责
Claude Code 特别像一种能力弱的员工:明明领导已经授权了,它还是缩手缩脚。哪怕是一件没有风险、没有成本、可撤销、对用户也没什么损失的小事,它也要回来问一句。
这不是成熟的谨慎。成熟的谨慎,是拿着一个可执行方案和风险判断来让领导拍板,可Claude Code 经常不是这样——它会先问“要不要做”,你说要,它才开始出方案;出了方案,它又问“要不要落地”;你说落地,它还可能在一个低风险步骤前再问一次。
最荒谬的地方在于,用户有时明明是在让它自己拍板,它却还在等“领导拍板”。你把任务交给它,是希望它从“等领导定”的状态里抽出来,结果它又把球踢回来。它看似尊重领导,其实是在把责任退回给领导。
这就是“不解放注意力”的另一层含义。你不是只在监督进度,你还要替它承担本来已经授权给它的判断。它每多问一次,你就多被迫回到现场一次。
它会优先选择让自己省事的解法
Claude Code 还有一个很像人类员工的弱点:如果一个问题有很多解法,而你不逼问它,它往往会优先选择自己“最不费脑子”的方案。
这种方案通常能解决当下问题,但不一定能减少未来的麻烦。它会把治标不治本的办法放进选项里,因为那条路最快、最省事、最容易交付一个“看起来有用”的结果。可对高认知的你来说,有的方案根本不应该出现在选项里——后期的维护成本太高。
在“让自己省事”和“让老板省事”之间,Claude Code经常先选前者。它会更在意自己“快点交一个东西”,而不是领导“以后少一点麻烦”;更在意“当下能不能过关”,而不是“这个解法是不是从根上解决问题”。
这背后还有一个更深的毛病:它对手段的关注远多于对目标的关注。它很容易沉迷于“我该跑哪些步骤”“我该生成哪个文件”“我该调用哪个工具”,但对“这件事值不值得做”“这个方案是不是会浪费用户时间”“这个动作对最终目标有没有价值”不够敏感。
这就解释了为什么你会觉得它像差员工。差员工不是完全不会干活,而是把“完成动作”当成“完成目标”。它把勾打了,把表填了,把计划列了,把材料交了,然后等你自己发现:这些东西离真正解决问题还差一截。
它在最不该解释的时候,特别爱解释
协作文档里最典型的场景是,用户指着一段话说:“这里错了,改一下。”
用户指出错误的时候,第一动作应该是纠错,而不是解释。已经确认是错的东西,没有必要在正文里继续占位置。解释最多只能在改完之后用一句话交代:“已把 X 改为 Y。”如果解释没有带来修改,它就不是负责,而是在给错误包边。
Codex 的反应通常更接近正常员工:删掉错的,换成对的,验证一下,然后告诉你“改好了”。这个动作不花哨,但很干净。
Claude Code 经常走另一条路:先解释“为什么错”,再解释自己“当时为什么那么写”,再解释“接下来会怎么改”。听起来态度很好,问题是,错误还在原地,解释已经堆成一小山。文档越改越长,错误上下文和解释性垃圾越来越多。
规则少了不行,规则多了也不行
更让人无奈的是,Claude Code 很会在规则里找到理由。
规则给少了,它说边界不清、要求不明确;规则给多了,它又说规则太多、信息过载、限制了自主发挥。你会发现,不管怎么调,执行不佳的理由总能出现。
这说明问题不只在规则数量。规则少,它缺少稳定推进能力;规则多,它缺少抓重点和持续执行的能力。真正缺的是一种责任感:把目标、规则、材料和结果统一起来,尽量让领导少操心。
所以要改 Claude Code,不能只往规则文档里继续塞条款。协作硬规则负责划边界,Output Style 负责塑造其“第一反应”,Harness 负责机械拦住旧毛病。比如重复确认、宣布即停、假落地、过程汇报过长,这些最好让系统外壳去拦,不要指望它每次都靠自觉。
好的员工不是“没有规则也能乱跑”,也不是“规则一多就趴下”。好的员工是能理解“规则为什么存在”,然后把事情做成。
它还会按交付对象偷偷降标准
我在协作文档中还发现一个很要命的细节:Claude Code 会误以为“给领导(用户)看的东西”才需要高标准,“给同事(跟自己协作的其他AI) 看的东西”标准可以低一点。
这个判断很离谱。给另一个 AI 看的规则、脚本注释、Harness 文案,并不代表可以写得”更随便“。恰恰相反,AI 的容错率可能比人更低。人类可以靠上下文猜,另一个 AI很可能因为一个引号、一个指代、一句边界不清的描述就误读。
所以真正的边界不是“人读还是机器读”,而是“是否承载自然语言意义”。变量名、路径、正则元字符可以按机器语法走;但注释、说明、规则、消息、概念描述,只要还在表达含义,就必须严谨。
这个细节特别像人类员工交付时的偷降标准:交给老板的东西包装得好一点,交给平级协作者的东西就随便一点。问题是,在多 AI 协作里,所谓“平级协作者”往往更容易误解。标准降了,最后还是领导(用户)兜底。
Codex 为什么反而更让你舒服
很多人说 Claude Code 更聪明,尤其是 Claude Opus 更聪明。但用下来会发现,所谓“更聪明”常常混着另一件事:它更爱解释,更爱拆问题,更爱把过程摊开给你看。
这在一种场景里确实有价值:你自己也半懂不懂,或者你根本不想思考,只是知道这件事重要、必须完成,那 Claude Code 的多问、多解释、多补背景,会让你觉得安心。它像一个会带着你一起探索的同事,能把空白处补上。
但如果你已经想得特别清楚了,Claude Code的这些优点就会变成干扰。你不需要它把问题重新讲开,不需要它把低风险动作拿回来“请示”,也不需要它用无意义的过程汇报证明自己“正在干活”。你要的是执行、验证、闭环。
在这种情况下,Codex 让你更舒服,不一定是因为它“智商更高”,而是因为它更像边界内的执行者。你给目标和规则,它去读文件、改文件、跑验证、交结果。除非碰到权限、外发、删除覆盖、不可逆操作、口味判断这类真正需要用户拍板的事,它一般不会把普通执行动作反复拿回来问。
这对高授权用户很关键。用户授权之后,AI 最好的礼貌不是多问一句,而是把事情做完。
Claude Code 不是没用,只是别放错位置
这篇文章不是要把 Claude Code 判死刑。它有适合的位置。
当你不熟悉任务,想让 AI 帮你探索、拆解、补背景、搭结构时,Claude Code 很有价值。写作早期、复杂上下文整理、多模型调度、半懂任务代劳、机制方案生成,这些地方需要一个会主动展开的协作者。在用户没有完整判断时,它的多说一点不是负担,而是扶手。
但当你已经想得特别清楚,想把明确任务交出去时,它就不应该继续扮演“陪你想”的角色。那一刻,你需要的是执行者,而不是讨论者;是能独立推进的员工,而不是需要你不断”陪跑“的人。
所以,同一个用户完全可能同时需要 Claude Code 和 Codex。不是谁永久更好,而是你当下想保留多少判断权。判断权留在你自己手里,AI 负责执行时,Codex 更顺。判断权需要部分交给 AI,让它带你探索时,Claude Code 更有用。
这也解释了”claude code比codex更贵“所带来的别扭感。如果一个更贵的工具总是只能当“备胎”,而更便宜的工具反而更像能接活的员工,领导当然会不平衡。更贵的那一方必须承担更难的角色,比如开放探索、复杂组织、多模型调度和综合复核;如果它连授权后的独立执行都做不好,价格越高,领导的心理落差越大。
真正的好员工,不是一直让你知道他“正在忙”
Claude Code 最大的问题,不是它不会主动,而是它常常主动错了方向。
它主动解释,主动确认,主动做过程汇报,主动把你拉回每个阶段。但高时间价值用户真正需要的主动,是AI能在授权范围内自己推进,遇到事实就核实,遇到错误就直接修改,遇到多任务就逐项完成,遇到确实越界的地方再回来请示。
如果你是那种“想清楚才授权、授权后不想再被拉回来的人”,Claude Code 就会像一个非常差的员工。它不一定坏,也不一定弱,但它的工作方式会让你一直回到现场。
它让你少动手,却没有让你“少盯着”。它减少了操作成本,却保留了监督成本。它看起来在协作,实际经常是在把你的注意力一片一片切走。
END

