OpenAI工程师不写代码了：AI写得太快，人类检查跟不上，Agent直接包办开发- 大数跨境

首页

OpenAI工程师不写代码了：AI写得太快，人类检查跟不上，Agent直接包办开发

AI前线

2026-03-09

导读：连“说明书”都Codex自己写的

作者｜木子

OpenAI工程师已基本不写代码

OpenAI近期在官方博客中披露：其内部工程师已极少手写代码。在一个内部项目中，仅用五个月时间，就产出超100万行代码——全部由Codex自动生成。

这些代码并非零散脚本，而是从零构建的一整套软件产品Beta版，涵盖应用逻辑、基础设施、工具链、文档及内部开发者平台等完整模块。

自下而上的工程文化驱动AI原生开发

这一转变根植于OpenAI长期坚持的工程师文化：小团队、快决策、高自主权。与多数科技巨头“高层定路线、团队执行”不同，OpenAI没有预设长期roadmap；研究员自发发现问题、提出构想，小团队围绕优质创意快速组建并推进落地。

“OpenAI非常注重自下而上的方式，尤其是在研究方面。”

Codex最初即诞生于一个十余人的小团队，仅用7周便完成从构想到上线的全过程。而此次“工程师不写代码”的实践，同样源于团队在AI编码规模化后发现的新瓶颈：

代码生成已非瓶颈，人工审查却成为最大阻塞点。

为突破QA环节的人力限制，团队转向新范式：让Codex模拟工程师行为，自主“观察”和“使用”应用系统。

工程师角色由此升级为：设计开发环境、构建反馈闭环、定义架构约束——即所谓“Harness Engineering”（AI驾驭工程），核心原则是“人类掌舵，智能体执行”。

工程师转型为“能力架构师”

该项目始于2025年8月下旬，首个提交即由Codex CLI调用GPT-5自动生成，内容包括代码仓库结构、CI配置、格式化规则、包管理器及应用框架等全部初始基建。

连指导agent工作的关键文档AGENTS.md，也由Codex自行编写。整个代码库几乎无一行人工代码，完全由agent逐步构建而成。

初期进展缓慢，并非因Codex能力不足，而是环境缺失：规则模糊、工具缺位、系统约束未建立。正如业内一针见血的总结：

“agent反复犯错，不是能力问题，是你脑子里的判断力没写下来。你不写，它第一百次还犯同样的蠢。”

此后，团队将问题归因于agent“能力缺口”，并系统性将其转化为可执行、可验证、可强制的规则。工程师工作重心转向更高维度：拆解任务、设计能力、搭建系统，确保agent稳定输出正确代码。

具体包含以下五项核心工作：

1. 让应用对AI“可读”

通过接入Chrome DevTools协议，赋予Codex操作UI的能力：读取DOM、截屏、监听Console与Network、模拟点击与输入，使其具备“眼睛”与“手”。

2. 将隐性知识显性化、机器可读化

AI无法访问Google Docs、聊天记录或人脑中的知识。所有规则、流程与上下文必须以结构化形式沉淀至代码仓库，并采用“地图式导航”而非“千页说明书”策略——避免信息过载与维护失效。

“要给Codex的是一张地图，而不是一本1000页的说明书。”

3. 设计“AI友好”的架构

AI在边界清晰、层级分明的系统中效率最高。团队强制采用固定业务域结构：Types → Config → Repo → Service → Runtime → UI，依赖方向严格单向，违规自动拦截。

4. 将“品味”转化为规则

工程师的审美标准（如文件大小限制、命名规范、日志格式、API设计原则）被编码为lint规则，使AI每次生成代码均自动遵循。“人类的品味一旦被捕捉，即可应用到每一行代码。”

5. 建立自动化“垃圾回收”机制

AI易复用既有代码模式，包括不良实践，导致代码风格漂移。团队将经验提炼为“黄金原则”（如优先复用共享库、严格校验数据结构），并直接嵌入代码仓库，由Codex自动扫描问题、发起重构PR，实现技术债动态清零。

Agent已覆盖全流程开发

当前，Codex驱动的agent已具备端到端开发能力，主要体现为两大能力跃迁：

1. 具备UI感知与交互能力

接入Chrome DevTools后，agent可复现Bug、运行UI测试、验证修复效果，承担起自动化QA工程师职能，大幅替代人工调试与回归测试。

其核心闭环为：Loop Until Clean——持续测试→识别缺陷→修改代码→再测试，直至系统无误。

2. 具备系统级可观测能力

通过集成Vector组件，agent可实时获取Logs、Metrics、Traces三类核心运行时数据，精准定位服务异常、接口延迟、调用链卡点，并自主完成代码修改、PR提交、服务重启、效果验证的全链路闭环。

整体开发流程已演进为：Codex写代码 → 启动应用 → 模拟用户操作 → 检查结果 → 不符合则自动修复重跑。该模式高度依赖定制化的仓库结构与工具链，尚不具备普适迁移性。

软件工程范式正在重构

OpenAI的实践表明：当传感器与执行器足够强大，反馈回路得以真正闭合时，人类角色必然从“执行者”转向“系统设计者与校准者”。这并非机器替代人力，而是工程重心上移——从写代码，转向设计环境、制定规则、构建反馈机制，使AI能稳定参与复杂系统的构建与演进。

【声明】内容源于网络

AI前线

面向AI爱好者、开发者和科学家，提供大模型最新资讯、AI技术分享干货、一线业界实践案例，助你全面拥抱AIGC。

内容 8123

粉丝 0

AI前线面向AI爱好者、开发者和科学家，提供大模型最新资讯、AI技术分享干货、一线业界实践案例，助你全面拥抱AIGC。

总阅读85.1k

粉丝0

内容8.1k