大数跨境

OpenAI工程师不写代码了:AI写得太快,人类检查跟不上,Agent直接包办开发

OpenAI工程师不写代码了:AI写得太快,人类检查跟不上,Agent直接包办开发 AI前线
2026-03-09
5
导读:连“说明书”都Codex自己写的
作者|木子

OpenAI工程师已基本不写代码

OpenAI近期在官方博客中披露:其内部工程师已极少手写代码。在一个内部项目中,仅用五个月时间,就产出超100万行代码——全部由Codex自动生成。

这些代码并非零散脚本,而是从零构建的一整套软件产品Beta版,涵盖应用逻辑、基础设施、工具链、文档及内部开发者平台等完整模块。

自下而上的工程文化驱动AI原生开发

这一转变根植于OpenAI长期坚持的工程师文化:小团队、快决策、高自主权。与多数科技巨头“高层定路线、团队执行”不同,OpenAI没有预设长期roadmap;研究员自发发现问题、提出构想,小团队围绕优质创意快速组建并推进落地。

“OpenAI非常注重自下而上的方式,尤其是在研究方面。”

Codex最初即诞生于一个十余人的小团队,仅用7周便完成从构想到上线的全过程。而此次“工程师不写代码”的实践,同样源于团队在AI编码规模化后发现的新瓶颈:

代码生成已非瓶颈,人工审查却成为最大阻塞点。

为突破QA环节的人力限制,团队转向新范式:让Codex模拟工程师行为,自主“观察”和“使用”应用系统。

工程师角色由此升级为:设计开发环境、构建反馈闭环、定义架构约束——即所谓“Harness Engineering”(AI驾驭工程),核心原则是“人类掌舵,智能体执行”

工程师转型为“能力架构师”

该项目始于2025年8月下旬,首个提交即由Codex CLI调用GPT-5自动生成,内容包括代码仓库结构、CI配置、格式化规则、包管理器及应用框架等全部初始基建。

连指导agent工作的关键文档AGENTS.md,也由Codex自行编写。整个代码库几乎无一行人工代码,完全由agent逐步构建而成。

初期进展缓慢,并非因Codex能力不足,而是环境缺失:规则模糊、工具缺位、系统约束未建立。正如业内一针见血的总结:

“agent反复犯错,不是能力问题,是你脑子里的判断力没写下来。你不写,它第一百次还犯同样的蠢。”

此后,团队将问题归因于agent“能力缺口”,并系统性将其转化为可执行、可验证、可强制的规则。工程师工作重心转向更高维度:拆解任务、设计能力、搭建系统,确保agent稳定输出正确代码。

具体包含以下五项核心工作:

1. 让应用对AI“可读”

通过接入Chrome DevTools协议,赋予Codex操作UI的能力:读取DOM、截屏、监听Console与Network、模拟点击与输入,使其具备“眼睛”与“手”。

2. 将隐性知识显性化、机器可读化

AI无法访问Google Docs、聊天记录或人脑中的知识。所有规则、流程与上下文必须以结构化形式沉淀至代码仓库,并采用“地图式导航”而非“千页说明书”策略——避免信息过载与维护失效。

“要给Codex的是一张地图,而不是一本1000页的说明书。”

3. 设计“AI友好”的架构

AI在边界清晰、层级分明的系统中效率最高。团队强制采用固定业务域结构:Types → Config → Repo → Service → Runtime → UI,依赖方向严格单向,违规自动拦截。

4. 将“品味”转化为规则

工程师的审美标准(如文件大小限制、命名规范、日志格式、API设计原则)被编码为lint规则,使AI每次生成代码均自动遵循。“人类的品味一旦被捕捉,即可应用到每一行代码。”

5. 建立自动化“垃圾回收”机制

AI易复用既有代码模式,包括不良实践,导致代码风格漂移。团队将经验提炼为“黄金原则”(如优先复用共享库、严格校验数据结构),并直接嵌入代码仓库,由Codex自动扫描问题、发起重构PR,实现技术债动态清零。

Agent已覆盖全流程开发

当前,Codex驱动的agent已具备端到端开发能力,主要体现为两大能力跃迁:

1. 具备UI感知与交互能力

接入Chrome DevTools后,agent可复现Bug、运行UI测试、验证修复效果,承担起自动化QA工程师职能,大幅替代人工调试与回归测试。

其核心闭环为:Loop Until Clean——持续测试→识别缺陷→修改代码→再测试,直至系统无误。

2. 具备系统级可观测能力

通过集成Vector组件,agent可实时获取Logs、Metrics、Traces三类核心运行时数据,精准定位服务异常、接口延迟、调用链卡点,并自主完成代码修改、PR提交、服务重启、效果验证的全链路闭环。

整体开发流程已演进为:Codex写代码 → 启动应用 → 模拟用户操作 → 检查结果 → 不符合则自动修复重跑。该模式高度依赖定制化的仓库结构与工具链,尚不具备普适迁移性。

软件工程范式正在重构

OpenAI的实践表明:当传感器与执行器足够强大,反馈回路得以真正闭合时,人类角色必然从“执行者”转向“系统设计者与校准者”。这并非机器替代人力,而是工程重心上移——从写代码,转向设计环境、制定规则、构建反馈机制,使AI能稳定参与复杂系统的构建与演进。

【声明】内容源于网络
0
0
AI前线
面向AI爱好者、开发者和科学家,提供大模型最新资讯、AI技术分享干货、一线业界实践案例,助你全面拥抱AIGC。
内容 8123
粉丝 0
AI前线 面向AI爱好者、开发者和科学家,提供大模型最新资讯、AI技术分享干货、一线业界实践案例,助你全面拥抱AIGC。
总阅读85.1k
粉丝0
内容8.1k