重新思考研发基础设施：当 Agent 成为第一公民- 大数跨境

首页

重新思考研发基础设施：当 Agent 成为第一公民

阿里技术

2026-06-03

导读：2026 的下半年，关于 Agent 我们可能最需要关注 Infra 的演进。

这是 2026 年的第 20 篇文章

本文阅读时间：约 30 分钟

（本文作者晓斌，阿里巴巴研发基础设施负责人）

前言：从一个周报系统说起

过去几个月，我构建了一个小型系统：通过 connector 打通代码托管、项目管理、数据平台及 IM 等多个异构系统，聚合活动数据并生成周报，最终发布至内部 Pages 站点。该系统的架构可概括为：connector 连接异构系统 → 规范化为统一活动流 → 意图（skill）驱动聚合与排版 → 生成单文件 HTML → 推送部署。

系统由三类核心组件构成：

Agent：核心驱动力。读取自然语言描述的意图文件（SKILL.md），动态生成 Python 脚本处理数据及 HTML 进行渲染。
代码：大部分为 Agent 运行时按需生成的短生命周期脚本，执行后即丢弃。
Infra：包括内部 Pages 托管、CI 部署及 Git 版本控制。对开发者而言，这些设施趋于“不可见”，Agent 自动完成推送与触发部署。

该系统的显著特征在于其意图是动态的。SKILL.md仅用自然语言描述需求，在单次迭代中可多次调整（如增加模块、调整顺序）。每次修改后，Agent 立即重新生成代码并部署，将迭代循环压缩至分钟级。

由此观察到两个关键现象：

代码即生即弃（Generated on the fly）：代码生命周期从“月/年”缩短至“分钟”。如同 JIT 编译生成的机器码，这里的脚本是中间产物而非资产。
Infra 透明化：Git、CI 等退居后台，开发者仅需表达意图并验收结果，构建与部署过程完全透明。

这一案例引发了一个深层思考：当越来越多的系统以此模式运行，当前围绕“人写持久化代码”设计的 Developer Infra 是否仍能胜任？

01 本质观察：软件是“意图驱动 + 代码沉淀”的进化体

无论是传统研发还是 Agent 研发，软件系统始终遵循“意图（不确定性）驱动 + 代码（确定性）沉淀”的进化模式。变化的仅是驱动与沉淀的速度及机制。

传统研发中的模式

在传统循环中：用户意图 → 产品经理压缩意图 → 研发翻译为代码 → 上线运行 → 新意图涌入。人是意图到代码的桥梁，受限于认知带宽，循环周期通常为周或月级别。

Agent 研发中的模式

引入 Agent 后，循环变为：意图（自然语言/SKILL.md）→ Agent 理解并生成代码 → 执行反馈 → 意图修正。桥梁从“人”变为"Agent"，循环速度压缩至分钟级。

对比两个案例可见模式的一致性：

镜像仓库建站（Agent 占比约 50%）：涉及跨平台配置的结构化 SOP。Agent 执行技术操作，人负责风控环节（如生产环境推送）。循环周期从 2 人日压缩至 1.5 小时，人机边界由出错代价决定。
周报系统（Agent 占比约 90%）：桥梁几乎全由 Agent 承担。人仅负责表达意图和验收。Connector 不仅连接 API，更隐含了工作规范，要求团队“按规范沉淀”而非单纯“按流程执行”。

两者的差异不在模式，而在速度。由此得出三个推论：

推论一：Agent 是加速而非革命。它未改变软件进化结构，只是将“意图→代码”的循环速度提升了数个数量级。
推论二：静态沉淀不会消失。不确定性消除后，确定逻辑应固化为代码。Agent 占比随时间呈锯齿形波动：新意图涌入时陡升（探索期），逻辑固化时缓降（沉淀期）。锯齿形态本身即是系统健康度的诊断工具。
推论三：基础设施面临重构。当循环速度从月级跃升至分钟级，原有基于慢循环假设（如离散构建、人工审批、稳定测试环境）的基础设施将成为瓶颈。

02 统一框架下的三个变量

Agent 改变了“意图驱动 + 代码沉淀”框架中三个关键变量的取值：

桥梁带宽：从人到 Agent

“意图→代码”的桥梁切换为 Agent，带宽提升数个数量级。人后退为意图表达者与结果验收者。在镜像建仓案例中，Agent 凭借无上下文丢失、不漏步骤的优势，实现了“新手+AI=老手产出”的效果，SOP 从“面向人的菜谱”转变为“面向 Agent 的可执行意图”。

沉淀粒度：持久代码与瞬态代码的分化

代码分化为两种形态：

瞬态代码：On the fly 生成的一次性中间产物，生命周期分钟级，用完即弃（如周报系统的数据处理脚本）。
沉淀代码：经反复验证后固化的逻辑，需版本控制与测试（如 connectors.yaml、CI 配置）。

越是动态的系统，越需要坚固的静态约束（类型系统、沙箱、权限边界）作为护栏。

循环频率：从发布周期到运行时反馈

迭代性质从离线、批量、有审批流的离散事件，转变为在线、增量、实时反馈的连续过程。“发布”概念变得模糊，系统在意图与反馈驱动下持续演化。三个变量的乘法效应导致原有 Infra 系统性失配。

03 把动态性推到极致

传统软件假设“意图可枚举”，而 Agent 将承担部分产品经理职能，在运行时直接理解用户意图并生成执行路径。面对开放意图空间，Agent 占比存在不可压缩的下界。这一变化将沿着“意图驱动”逻辑，深刻影响产品形态与组织分工。

04 从三个案例看 Agent 与 Infra 的摩擦

以下三个案例揭示了现有 Infra 在适配 Agent 时的痛点：

案例一：多角色 Agent 研发系统

基于内部研发 CLI 搭建的多角色 Agent 系统（Discovery、Delivery、Examiner 等）覆盖了完整研发链路。尽管 CLI 已具备一定 Agent 友好性，但实际运行中痛点密集：

运行环境手工搭建：缺乏根据角色、任务自动组装的完整工作环境（Harness）。
规范缺乏机器可读承载：研发标准散落在文档与经验中，Agent 只能临场猜测。
接口残留“人用”痕迹：缺乏强类型区分，隐性规则未显式化，状态机边界模糊。
验证难度梯度大：从 CLI 到 Web 端验证难度剧增，缺乏自动化手段。
Code Review 缺上下文：Review 者难以获取需求背景与设计意图，只能关注表面问题。
缺乏可重复实验场：缺乏可控的 Dry-run 环境与 Mock 机制。

案例二：配置推送——自主程度取决于安全护栏

在镜像建仓案例中，阻碍 Agent 自主推送配置的并非能力不足，而是 Infra 侧缺乏资源归属治理、Dry-run 能力及分级回滚机制。一旦提供严格的权限管控与变更预览（Dry-run），人员即可放心授权。

Agent 能否自主操作，不取决于 Agent 有多聪明，而取决于 Infra 提供了多强的安全护栏。

案例三：身份与鉴权的碎片化

Agent 需跨越多个系统（Git、CLI、中间件、监控），面临多套身份体系并存的问题。人的角色分工曾屏蔽了这种复杂度，但 Agent 打破了边界，导致身份切换频率呈指数级放大。理想状态是 Agent 拥有一个在所有 Infra 上通用的统一身份。

共性根源

上述问题的根源在于：现有 Infra 均为面向人（People-Oriented）设计，依赖人的常识、责任心与低频操作来弥补机制缺失。而 Agent 无常识、高频操作且需自动恢复，必须依赖面向 Agent（Agent-Oriented）的机制化保证。

05 设计原则：从 People-Oriented 到 Agent-Oriented

面向 Agent 的 Infra 设计，本质是将隐式依赖人的认知与责任心，显式化为系统机制。Infra 需在四个层次提供能力，以扩大 Agent 的安全自主空间：

可理解（Comprehensible）：系统概念体系自洽完整，不依赖隐性知识。运行环境需自描述（Manifest/Devcontainer），确保 Agent 能建立正确心智模型。
可操作（Operable）：支持 Dry-run、幂等重试、原子组合操作及隔离执行。凭证不应进入沙箱，而是通过 Vault 或代理注入。建立渐进信任机制，低风险操作自主执行，高风险操作需人工确认。
可感知（Observable）：状态与结果需结构化、实时且语义丰富。避免沉默失败，每次响应需提供足够信息供 Agent 决策下一步行动。
可追溯（Traceable）：支持状态恢复、过程回放与行为审计。Agent 的失败模式是 Infra 设计缺陷的放大器，可通过其行为数据度量 Infra 质量。

06 行业趋势与我们可以做什么

行业实践印证了上述判断：

并行 Agent 需要并行 Infra：Superset 等案例表明，环境初始化速度直接决定并行效率，Infra 吞吐量需随 Agent 数量线性扩展。
Human DX 与 Agent DX 正交：Google Workspace CLI 等实践强调，Agent 首要优化的是可预测性（Predictability）而非可发现性。需通过 Schema 自省、输入加固及响应消毒来防止 Hallucination。
Credential Brokering 成为共识：多家厂商趋向于引入凭证代理层，Agent 仅携带占位符，由代理层替换真实凭证，实现“使用但不持有”。

行动建议

Harness 平台化：将 Agent 运行环境内建为平台能力，支持声明式定义与即时供给。
统一身份体系：构建 Agent-native 身份，实现全 Infra 通用、自动轮转及最小权限，远期迈向 Credential Brokering。
Dry-run 基础设施化：在 Infra 层提供统一的变更预览能力，标准化输出 Diff、影响范围及风险等级，作为渐进信任的基础。
验证体系演进：融合传统测试与 Agent 评测，从精确匹配转向约束满足，建立持续验证机制。验证基础设施的投资优先级应高于生成能力。
Agent 行为驱动的度量：利用 Agent 的重试频率、错误类型等行为数据，量化并改进 Infra 的 Agent 友好度。

未来的 Git、CI/CD 系统将收缩至“持久化代码”领域，而支撑"Agent+Code"动态混合体的新一代基础设施将成为建设重点。Infra 的能力边界，即为 Agent 的自主边界。

致谢：感谢残风、星楚、晚馡提供的实践案例和深入讨论，感谢飞桨分享的沙盒环境 Agent 鉴权实践。

参考资料

Vercel Blog, "How Superset built the IDE for AI agents on Vercel", 2026-05-10.

[2] Justin Poehnelt, "You Need to Rewrite Your CLI for AI Agents", 2026-03-04.

[3] Tony Dang, "Credential Brokering for AI Agents", Infisical Blog, 2026-05-23.

脚注

文中"研发 CLI"指公司内部覆盖代码仓库、MR、CR、发布流水线等研发全流程的命令行工具。"统一鉴权框架"指公司内部统一多个 CLI 身份体系的鉴权框架。两者均为内部系统，名称已做脱敏处理。
飞桨，《沙盒环境 Agent 7×24 小时工作，免登鉴权怎么破？》，内部技术社区，2026-05-26。

*封面头图来自 MoMa，侵删。

【声明】内容源于网络

阿里技术

阿里技术官方号，阿里的硬核技术、前沿创新、开源项目都在这里。

内容 429

粉丝 0

阿里技术阿里技术官方号，阿里的硬核技术、前沿创新、开源项目都在这里。

总阅读20.5k

粉丝0

内容429