3月31日,Anthropic发布Claude Code 2.1.88版本,表面平静。一小时后,安全研究员Chaofan Shou在X平台披露:通过npm包中的source map文件,成功获取Claude Code完整TypeScript源码——共51.2万行、1900个文件、覆盖35+子系统。
24小时内,GitHub涌现多个fork仓库,其中一项目获3.2万星标、4.4万次fork。全球开发者迅速展开深度分析,将其视为一场价值数十亿美元的AI工程架构公开课。
Claude Code这次究竟暴露了啥?
需明确:泄露内容并非AI模型本身,而是Anthropic官方封装的Claude Code工程代码,涵盖模型调度、记忆管理、工具调用与权限控制等全链路系统逻辑。
类比而言:AI模型是“千里马”,泄露的是“驯马师手册”。技术风险有限,但战略价值极高——它首次系统揭示了头部玩家如何规模化管理AI工程师、构建AI原生产品。
读懂这套架构,未必能立即开发出优秀AI产品,但将显著提升AI使用效能与工程化认知深度。
三层记忆与睡眠模式
长期对话中AI易出现“上下文熵增”:记忆模糊、函数名混淆、任务目标遗忘——这是当前AI编程工具的普遍瓶颈。
Claude Code源码揭示其核心解法:三层记忆架构。
第一层:MEMORY.md 轻量索引
每次会话启动时加载MEMORY.md,该文件不存储原始数据,仅维护结构化索引(如文件路径、模块说明),单行约150字符,总容量严格限制在25KB以内,防止工作记忆被冗余信息污染。
第二层:主题文件,按需加载
项目知识按功能/模块拆分为独立主题文件,AI仅在执行相关任务时动态加载对应内容,显著降低上下文窗口占用。
第三层:完整会话记录,可搜索但不回读
全部历史对话均持久化保存,但AI默认不重复加载整段会话;仅当需确认具体细节时,触发关键词搜索并提取相关片段,实现精准上下文复用。
三层协同,在最小上下文开销下支撑最大知识覆盖范围。更进一步,Anthropic还部署后台进程KAIROS,运行AutoDream(自动做梦)机制——模拟人类睡眠期的记忆整理。
AutoDream四大步骤:
- 定向扫描:读取MEMORY.md及现有主题文件
- 信号采集:从日志中提取新信息,识别“记忆漂移”,剔除与当前代码冲突的旧认知
- 整合归并:融合新信号至主题文件,将相对时间表述转为绝对时间,删除过时事实
- 修剪索引:更新MEMORY.md,确保始终≤25KB
Claude Code正演进为“常驻CTO”:持续记忆项目状态,并在空闲期自主优化、更新对项目的理解。
从提示词工程到Harness工程
源码曝光前一周,Anthropic Labs工程师Prithvi Rajasekaran在官方博客发布《Harness Design for Long-Running Application Development》,提出全新范式——Harness Engineering(缰绳工程)。
行业演进脉络清晰:2024年聚焦提示词工程,2025年转向上下文工程,2026年核心战场已升级为Harness工程:即设计系统级机制,约束AI在长周期、高复杂度任务中稳定输出,杜绝偏航与失焦。
Rajasekaran指出AI独立完成复杂编程存在两大根本缺陷:
- 上下文焦虑:因担忧token耗尽而仓促收尾,属行为偏差,非幻觉问题
- 自我评估偏差:AI难以客观审查自身产出,类似学生自评试卷,普遍高估质量
其解决方案借鉴GAN思想,构建双Agent协作框架:
- Generator(生成器):专注编码实现
- Evaluator(评估器):基于Playwright真实操作应用(点击、表单提交、API测试),依标准评分并反馈缺陷
以“开发2D复古游戏编辑器”为例:
- 单Agent模式:20分钟完成基础功能,成本9美元,成品仅可查看不可运行
- Harness工程模式:6小时开发,成本200美元,交付完整可玩产品,并自动扩展出精灵动画、行为模板、音效系统、AI辅助关卡设计、导出分享等16项增强功能
成本增长20倍,但实现了从“能看”到“能用”的质变。对创业者而言,Harness工程代表新机会点:无需自研大模型,仅在AI调度、评估与协同层面构建差异化方案,即可孵化高价值AI原生产品。
重新认识AI时代的护城河
AI工具的竞争壁垒持续迁移:2024年比拼模型能力,2025年转向上下文管理效率,2026年回归本质——系统工程能力。
Claude Code源码泄露印证一个关键结论:模型是发动机,之上的一切工程设计才是造就赛车的关键。
从提示词工程、上下文工程到Harness工程,AI技术范式正以半年为周期快速迭代。真正决定竞争力的,不再是追逐概念,而是掌握底层系统思维与落地方法论。

