Anthropic 官方承认 Claude Code 出现性能下降问题,并发布长文说明原因。
经调查,问题源于三个独立的技术改动,时间跨度为3月4日至4月20日,影响范围包括 Claude Code、Agent SDK 和 Cowork,API 服务未受影响。
作为补偿,所有 Claude 订阅用户的使用额度已重置。
问题溯源:三大技术 Bug
01|默认思考等级被误设为 medium
3月4日,Anthropic 将 Claude Code 默认思考等级从 high 调整为 medium,理由是降低延迟、避免 UI 卡顿。上线时提示用户“建议使用 medium”,多数用户据此接受默认设置。
开发者实际需要的是深度思考能力更强的 high 或 xhigh 模式。4月7日,Anthropic 已恢复默认设置:Opus 4.7 默认 xhigh,其余模型默认 high。
官方对比数据显示:Opus 4.7 的 xhigh 模式准确率达 71%,而 Opus 4.6 的 medium 模式仅为 48%,差距超 20 个百分点。
02|缓存优化引发“边干边忘”问题
3月26日上线的缓存优化本意是:当会话空闲超1小时后,清理旧缓存以节省 token。但实际部署存在 bug——每次 API 请求均清空历史思考内容。
结果导致 Claude 在连续任务中频繁遗忘上下文,表现为重复输出、工具选择异常、逻辑断裂等。该问题还间接导致提示缓存失效,加剧 token 消耗速度。
该 bug 已于4月10日在 v2.1.101 版本修复。值得注意的是,Anthropic 后续用代码审查工具回测发现:Opus 4.7 可识别此 bug,Opus 4.6 则无法识别,侧面印证其推理能力确有下降。
03|系统提示词新增“精简回复”指令反致能力下滑
4月16日 Opus 4.7 上线后,Anthropic 在系统提示词中加入限制性指令:“工具调用间文本≤25词;最终回复≤100词,除非任务必需。” 目的是控制 token 消耗。
但该指令意外导致 Opus 4.6 与 Opus 4.7 编程能力同步下降约3个百分点。因编程依赖逐步推演过程,强制压缩表达实为抑制思考深度。
该指令已于4月20日 v2.1.116 版本移除。
后续改进措施
Claude Code 负责人 Boris Cherny 表示,此次排查难度极高,根本原因隐蔽且干扰项众多。三个 bug 分别在不同时间段、以不同方式影响不同用户,叠加呈现为“广泛但不一致的性能下降”。内部测试未能提前发现,最终依靠用户提交的可复现案例锁定问题。
Anthropic 承诺实施以下改进:
- 内部员工将统一使用对外发布的 Claude Code 正式版本,取消内部特供版;
- 系统提示词任何修改均需开展全量评估与逐行消融实验;
- 凡可能牺牲模型推理能力的改动,须先小范围灰度验证,再全量上线。
所有 Claude Code 订阅用户的使用额度已重置。

