TECH INSIGHT • 深度智库
阿里OPT梦碎,Claude全员禁用
大家好,我是刀哥。做过大厂研发、做过出海硬件,现在深耕 AI 编程和 AI 工具。
一、OPT:一个人就是一支队伍
2026年上半年,阿里巴巴内部开始推行一个叫 "OPT" 的新机制——One Person Team,一人团队。
对,没看错,阿里是会造词擦边的,把全国火热的opc一改,变成opt了。
以前一个项目,产品出需求、设计给方案、前端写页面、后端搭接口、测试找bug,环环相扣,层层接力。现在,链条压缩到一个人身上:你一个人,就是整条业务链路。前端要懂后端,后端要顾前端,运营得会看数据,产品得能写SQL。
官方说法很漂亮:砍掉沟通成本,提升决策效率。阿里内部347赞的热帖评论区,一眼望过去全是焦虑——一个人干三个人的活,工资涨不涨另说,压力是实打实的。有员工调侃:"以前是团队作战,现在是一个人扛着整个项目的KPI。"
政策能不能落地不好说,但信号很明确:组织在变轻,个人得扛得住。
问题是,一个人怎么扛?
阿里给出的答案是——AI。今年年初,阿里不仅提供内部自研模型的免费额度,还对外部模型实行大额报销,员工可以自由选择 Claude、GPT、Gemini 等外部AI工具。部分程序员每周消耗额度高达数百美元,Claude Code 更是成为高频工具。
在阿里的OPT蓝图里,每个员工都应该是一个"超级个体"——自己用AI写代码、自己用AI做设计、自己用AI跑数据。一个人+一群AI,就能跑完一整个项目。
但是理想很丰满,现实很骨感。程序员的唯一真神Claude——被人连根拔走。
二、禁令:最顺手的工具,一夜之间没了
7月3日,阿里巴巴内部突然宣布:全面禁用Anthropic旗下Claude全线产品,7月10日生效,全员卸载。
从Sonnet、Opus、Fable等模型到Claude Code等Agent工具,一刀切,不留余地。
导火索可以追溯到6月10日。Anthropic向美国参议院银行委员会递交信函,指控阿里在4月22日至6月5日期间,利用约2.5万个虚假账号与Claude进行了超过2800万次对话交互,定性为"工业级模型蒸馏攻击",并上升至国家安全层面。
随后Anthropic对Claude实施大规模封号,大量中国用户被波及。更令阿里难堪的是,开发者逆向分析发现,Claude Code自2.1.91版本起内置了隐蔽检测中国用户的机制——通过读取系统时区、检查代理或API地址中的中国云厂商关键词,以隐写术在系统提示词中做标记。
地缘政治的子弹,最终还是打到了每一个普通程序员身上。
阿里的OPT员工们突然发现:昨天还在靠Claude Code一天搞定3000行代码,今天就得全部重来。 官方推荐的替代方案是自研的 Qoder,但问题是——Qoder真能顶得上吗?还有,OpenAI的Codex呢?同样是顶级代码模型,能不能替代?
三、为什么不用Codex?三个硬伤告诉你:它顶不上
很多非程序员第一反应:Claude不让用了,用OpenAI的Codex不就行了?
答案很简单——在大公司的屎山级代码库面前,Codex根本扛不住。
硬伤一:上下文污染,窗口越大越浪费
Codex每次启动会自动扫描当前目录的全部文件。遇到没有AGENTS.md的大型项目时,光读文件就能消耗几十万token,真正留给推理和代码生成的空间被大幅压缩。测试日志、无关文件、大段输出不断污染上下文。
模型变笨是因为能力不够,而是上下文被垃圾信息塞满了。 有开发者直言:"Codex频繁说'已超过上下文限制',根源不是窗口绝对不够,而是窗口被低效使用了。"
相比之下,Claude的1M全量注意力窗口,配合Prompt Caching技术,跨几百个文件时能保持极高的上下文连贯性,不丢细节,理解精准。
硬伤二:提示词二次方增长,越聊越慢
OpenAI工程师在技术解析中承认,Codex每次API调用都发送完整的对话历史。随着对话增长,提示词呈二次方膨胀——虽然缓存能部分缓解,但任何操作(切换模型、修改配置)都可能导致缓存失效。
聊得越长,Codex越慢、越贵、越笨。 在阿里需要长期维护的复杂项目中,这个问题会被成倍放大。
硬伤三:快,但不稳;便宜,但质量堪忧
来看硬指标。在业界公认最权威的 SWE-bench 真实GitHub问题修复测试上,Claude Code得分72.5%,Codex只有约49%——23个百分点的差距,不是略逊一筹,而是代际差异。
Claude Code生产级代码首轮通过率达到 92-95%,Codex在同等任务下生成的commit质量明显偏低。开发者社区有一个直观感受:Claude Code更像一位资深工程师——严谨、有教育意义、注重代码质量;Codex更像一个追求速度的实习生——快,但容易出错。
Codex的优势在于快和省——处理同等任务消耗的token约为Claude的1/3。但这种"快"是有代价的。在复杂多文件重构、生产系统级任务中,Codex生成的代码往往需要大量人工修复。
对于大公司动辄几百万行的屎山代码库,Codex这种"先跑起来再说"的哲学,恰恰是最危险的。
实际工作中,我也是只用codex review代码,交叉使用。AI编程铁律,最贵的就是最好的,想省钱的结果往往是,无数个bug和无数次返工,反而更浪费时间。
四、梦碎的本质:依赖别人的枪,打不了自己的仗
阿里OPT的愿景很美——让一个人+一群AI成为标准配置,覆盖项目全链路。
但这个梦碎揭示了三个残酷真相:
第一,顶级AI能力是有国界的。 Anthropic的指控、Claude Code的隐蔽检测、美国出口管制——地缘政治正在把AI工具变成战略武器。阿里的OPT依赖外部AI,就像在别人的地基上盖楼。
第二,顶级AI能力是有代价的。 Claude的聪明靠的是天量算力和美元堆出来的,需要恐怖的GPU显存,依托NVIDIA高端生态。这种烧钱模式既是技术壁垒,也是供应链命门。 一旦断供,再宏伟的OPT蓝图也只能停摆。
第三,替代品并不好找。 Codex快但质量不稳,国产模型能力差距客观存在。在屎山面前,够用往往意味着大量隐患。
依赖别人的枪,打不了自己的仗。 Claude再强,是别人的;Codex再快,也是别人的。阿里还有Qwen系列、Qoder等自研产品,但补齐与Claude旗舰的差距,需要的不只是决心,更是时间、算力和芯片。
这场梦碎,或许正是国产AI自主化必须经历的阵痛。OPT的理念没有错——一个人+AI确实是未来。但前提是:那把枪,得握在自己手里

