整理 | Tina
一小时复现一年工作?谷歌主管工程师亲测 Claude Code
1月3日,谷歌主管工程师、Gemini API 负责人 Jaana Dogan 在 X 平台发文称:其团队过去一年专注构建的分布式 Agent 编排系统,被 Anthropic 的 Claude Code 仅用一小时就完成原型开发,输出结果与团队成果高度接近。
她强调:“这不是玩笑,这件事一点也不好笑。”
Dogan 补充说明,该测试基于元旦假期期间的“玩具项目”,未使用任何谷歌专有信息或内部细节;问题描述仅三段文字。她指出:“它还不完美,我也仍在迭代打磨,但现实就是如此。”
她建议开发者在自己最熟悉的领域中实测:从零构建一个足够复杂的功能,亲自评估 AI 输出的可靠性与实用性。
需注意的是,Claude Code 目前在谷歌内部仅限用于开源项目,禁止处理公司代码。
行业仍处研究探索期
Dogan 指出,当前 coding agent 整体仍处于“全行业研究项目”阶段——大模型能力持续演进,工程化与产品化将在价值明确后逐步推进。
她坦言,三四年前曾考虑退休:彼时行业呈现“过度饱和”,大量基础设施重复建设却未显著降低复杂度。而 AI 编程浪潮带来了真正的新问题,重新激发了工程师的研究热情。但她也反思:LLM 的快速普及,正引发更强烈的情绪化反应,削弱理性探讨空间。
她总结 AI 编程能力跃迁节奏:
- 2022年:单行代码补全
- 2023年:生成完整代码片段
- 2024年:跨文件协作,构建简单应用
- 2025年:创建并重构整套代码库
“2022年时,我根本无法相信2024年的里程碑能作为面向全球开发者的产品真正落地。质量和效率的提升,已远超所有人预期。”
前谷歌与Meta杰出工程师、Gemini共同作者 @arohan 补充称:若早年可用 agentic coding(尤其 Opus 级别模型),他或将职业生涯最初6年的积累压缩至数月。更重要的是,AI 编程本质是一种“反萎缩机制”——人在持续做判断、执行与反馈的过程中,技能得以保持锋利。
写代码很快,难的是对齐
Dogan 作为谷歌核心架构师,公开肯定竞品能力,引发广泛关注与争议。作为以“实操落地”见长的工程体系顶端角色,她主导过面向全球规模的系统设计;加之深度参与 Gemini 工作,其表态被视为技术风向标之一。
围绕“一年 vs 一小时”,业内迅速展开深层讨论:被压缩的究竟是什么?
有观点指出,“AI一小时做完我们一年的事”背后,人类实则已耗时一年完成最难的部分——定义问题、厘清边界、规避陷阱。AI 只是在已有认知框架下高效复现。写代码本身反而是最易环节;真正消耗时间的是会议、对齐、架构争论、需求梳理与风格纠结——而这些,Claude 并未参与。
亦有开发者自嘲:多年培养的技术直觉与工程品味,正被一个“概率文本模型”在所谓“微妙”领域持续超越;尽管输出可运行、能过测、可替代数月工作,但它“不理解自己在做什么”,而人类工程师——哪怕复制 Stack Overflow 代码——也“绝对理解”。结尾直言:“如果 AI 真那么强,它早就让我失业了;既然我还有工作,那这一切大概率仍是炒作。”
有网友向 Dogan 提问(尚未获回应):过去一年中,有多少时间实际用于准确定义问题规格与边界,而非编码执行?
该提问切中要害——一旦问题可被完整描述,并能智能引导执行避开所有陷阱,实现往往只需极短时间。一位工程师分享经验:他曾与同事一夜重写大量代码,但真正花费数年的,是寻找“正确解法”;解法一旦确认,编码仅需数小时。
也有评论指出:这一现象暴露长期被忽视的事实——大量开发时间并非消耗于写代码,而是被会议、规划、调试及频繁上下文切换吞噬。AI 的价值,正是在这些噪音之上直接“切一刀”。
随之而来的担忧是:企业看到效率跃升后,可能优先选择削减人力,而非将工程师转向更高阶的系统设计、架构创新与产品定义工作。
日常层面,也有开发者感慨:几乎每天早上都计划“干成不少事”,结果一抬头已是下午两三点,脑子里仍停留着同样的想法——冗余会议已成常态。
面对巨大争议,Dogan 于次日发推澄清:“做出第一个版本,不等于做成一个产品。”
谷歌与 Anthropic 的合作关系
当被问及 Gemini 何时具备同等能力时,Dogan 回应称,其团队正“全力推进模型与基础设施建设”。
值得注意的是,谷歌是 Anthropic 的重要投资方,持有约14%股份;双方合作早在2025年10月深化:谷歌承诺向 Anthropic 提供最多100万颗TPU(张量处理单元),总价值达数百亿美元。该项目预计2026年上线超1吉瓦算力,为AI史上最大硬件承诺之一。Anthropic 公开表示,选择谷歌 TPU 是因更优成本效率、稳定性能及谷歌长期技术积累。
“这个行业从来不是零和博弈。即便对方是竞争对手,也完全可以坦然承认他们做得出色。Claude Code 的工作令人印象深刻,它让我更加兴奋,也更有动力继续向前。”
Anthropic Claude Code 创建者 Boris Cherny 曾披露:2025年12月,他在30天内完成259个 PR、497次提交,新增约4万行代码、删除约3.8万行代码——所有代码均由 Claude Code 搭配 Opus 4.5 生成,期间未打开一次 IDE。
他总结高效工作流的核心原则:必须建立稳定验证反馈回路,质量可提升2–3倍。具体实践包括——
- 任务首选 Plan 模式,先夯实方案再集中实现;
- 高频操作通过 slash commands 和子 agent 固化为可复用流程(如自动简化、端到端测试);
- 长周期任务启用后台 agent 复查,并行调度多个 Claude 实例;
- 代码评审中,直接在同事 PR 中 @Claude 补充文档或规则说明;
- Claude Code 可接入 Slack、BigQuery、Sentry 等工具,嵌入完整工程链路。
Dogan 正是在关注 Cherny 这套方法论后,发布了引发全网热议的对比推文。

