2026年5月,Sequoia Capital的舞台上,黄仁勋一开口就把在场的工程师听众钉在了椅子上。
“You see it in ChatGPT, in Codex, in Claude Code — agentic systems are the big shift.”
「你在ChatGPT、Codex、Claude Code里都能看到——agentic系统才是最大的转变。每个工程师将同时跑100个Agent。」
不是比喻,不是远景畅想。他接着掏出了一整套正在运行的证据链:从NVIDIA内部芯片设计流程,到RTX Spark个人电脑,再到专为Agent设计的Vera Rubin超级计算机。英伟达自己已经在用数百个Agent并行验证芯片设计,周期从数周压到数小时。
软件工程的底层规则正在被他改写。
▲ Sequoia Capital舞台,黄仁勋明确表示agentic systems是当前最大转变,每个工程师将同时跑100个Agent(来源:@0xMovez)
生成式AI只是序章,Agent才是正文
过去三年,整个行业都在聊“AI辅助编程”。GitHub Copilot帮你补全一个函数,ChatGPT帮你写一段脚本,Claude帮你解释一段代码——但所有这一切,本质上还是“人为主”:你想问题,AI出建议,你来落地。
黄仁勋看到的拐点是另一个层级。
在GTC 2026的媒体问答中,他把话说得更明白:“Claude Code彻底革命了软件工程。英伟达100%的工程师都在用其中一种或多种,没有一位软件工程师不借助AI助力。”
关键变化在于Agent具备了“行动能力”。它会观察当前状态、规划步骤、调用外部工具、执行操作、检查结果、自我迭代——你不再是一个“会提问的用户”,而是一个“给团队分配任务的指挥官”。
用最简单的方式理解:prompting是你对AI说“写个排序函数”,它吐几行代码,你验收修改。Agent模式是你对AI说“帮我搭一个完整的用户登录模块,含前端验证、后端API、单元测试、安全审查”,AI自己拆解任务、调用编辑器、写测试、跑lint、改bug——你只需要在关键节点做决策。
当这个能力被乘以100,场景就不再是“一个聪明的助手”,而是“一个人管理一个虚拟工程团队”。
▲ Mayur博客整理NVIDIA 100 Agent愿景:未来每个人将指挥100个自主Agent(来源:Mayur)
100:1不止是口号,NVIDIA已经把全栈武器架都亮出来了
黄仁勋最让人后背发凉的地方不在于他喊了一句口号——在于他把底牌全部摊在了桌面上。
从硬件到软件,NVIDIA正在为“一个人指挥100个Agent”铺设一条完整的管道。
个人端:RTX Spark。Blackwell RTX GPU配20核Grace CPU,128GB统一内存。核心卖点是本地跑Agent,不需要云端。黄仁勋在GTC上做了现场演示:一个Agent从概念草图出发,自己在Rhino里建模,在Blender里渲染,在Flux里生成多视角效果图,完整设计完一栋房子。黄仁勋的原话是“整个过程全部由Agent自己完成”。过去四十年我们习惯了“启动应用、点击菜单、键盘输入”,新的范式是“直接告诉Agent目标,它自己去操作各款软件”。
数据中心端:Vera Rubin。五机架AI超级计算机,专为Agent工作负载设计。吞吐比上一代Grace Blackwell在Agent任务上提升10倍。里面塞了NVL72高吞吐推理大脑、Groq LPU低延迟token生成单元、BlueField-4存储、Spectrum-X共封装光学网络(功耗降5倍、可靠性提5倍)。供应链规模是Grace Blackwell的两倍,组装却从2小时缩短到5分钟——PCB中板、全液冷、热插拔。
软件端:OpenClaw + NemoClaw。黄仁勋把OpenClaw称为“agentic computer的操作系统”,类比Windows之于PC。NemoClaw则是企业级版本:一键安装Nemotron模型,自带安全沙箱OpenShell、策略引擎、隐私路由,支持云、本地、RTX PC、DGX。黄仁勋的判断是:“世界上每家公司现在都需要一套OpenClaw战略,一套agentic系统战略。”
模型端:Nemotron 3 Ultra。开源,SSM加MoE混合架构,专为长时程推理优化——这正是Agent连续执行多步任务最需要的能力。速度快近5倍,成本降30%,模型、数据、训练脚本全部开源。
连起来看,这个布局里没有一处留给“万一Agent不成”的退路。
▲ NVIDIA官方发布NemoClaw:OpenClaw开源项目加企业安全层,黄仁勋称其“打开了AI的下一个前沿”(来源:NVIDIA Newsroom)
芯片设计先被重构了
黄仁勋屡次拿自家芯片设计流程举例,这个案例比他任何一句金句都更有杀伤力——因为它已经跑通了。
一颗AI芯片里有数万亿晶体管。传统设计流程中,数千名芯片设计师手动写RTL代码、搭建测试平台、跑回归验证、形式验证、定位Bug、修Bug、再跑。一个Bug可以让项目延期数月。NVIDIA每年消耗数十亿计算小时在设计验证上。
Agent介入以后的流程完全不同:Codex充当“项目经理”负责全局调度,Nemotron负责需要深度推理的判断,一群专项子Agent分头写RTL、生成测试平台、跑回归、抓Bug、出修复建议。Cadence的Xcelium仿真器和Jasper形式验证工具被Agent自动调用,OpenShell沙箱兜底安全。
结果,原本需要数周的设计验证周期被压缩到数小时以内——速度提升超过40倍。
黄仁勋在GTC上直接说:“英伟达拥有数千名芯片设计师,我们将引入数十万名Cadence超级智能体与我们协同工作。”
这个流程的目标不是裁人。参与其中的工程师角色发生了根本变化:从坐在键盘前一行行敲代码,转向定义设计规格、审查Agent的关键决策、处理异常情况、持续优化Agent之间的编排策略。一个人加一支上百Agent的虚拟团队,产能远超过去一个人死磕。
工程师的新角色:从码农到指挥官
如果100 Agent成为标配,软件工程这个职业的定义就要重写。
旧的画面:80%时间敲代码、调试、写测试、等编译。新的画面:80%时间思考架构、分解任务、审查Agent输出、处理集成和异常、做高层决策。“Build → Loop → Control → Repeat”成为新的工作循环。
黄仁勋还抛出了一个让很多人坐不住的观点:token预算将来会变成薪酬结构的一部分。一个年薪50万美元的工程师,如果一年只花5000美元在token上,那他是在“把生产力留在桌上”。黄仁勋暗示的理想比例是薪酬的50%花在算力上——也就是说,25万美元的token预算,用来驱动你的Agent团队。
反过来看,这意味着未来区分工程师水平的,不再是“你手速多快、你记得多少API”——而是“你能同时高效调动多少个Agent、你的任务拆解质量有多高、你的审查判断有多准”。
行业里已经开始出现对应的新头衔:Agent Wrangler、AI Systems Architect、Agent Orchestration Lead。GitHub上有人晒出自己24/7跑着17个Agent,月commit量暴增——但代价是“连续思考8小时比写代码累多了,脑子像被榨干”。
McKinsey 2025年11月的调查显示,62%的组织至少在做Agent实验,但接近三分之二还没实现规模化。所有人都在往这个方向跑,但大多数人还没跑到。
▲ 中文商业媒体把NVIDIA战略概括为“黄仁勋的Agent工厂”,从硬件到软件全栈布局(来源:华尔街见闻)
现实没有黄仁勋说得那么丝滑
愿景没有问题,但社区里的实战派已经列出好几道硬门槛。
记忆是最大拦路虎。当前大多数Agent系统没有长期记忆,每次会话重置,像一个每次上班都失忆的员工。你没法把上周积累的上下文交给它,它也没法记住上次踩过的坑。更麻烦的是,多个Agent并行时缺乏共享记忆——Agent A发现的bug,Agent B可能完全不知道,然后犯同样的错。
编排成本容易失控。100个Agent同时跑,token消耗是指数级的。如果架构设计不合理,很可能花了几百美元token烧出一堆互相矛盾的结果,人工review的时间反而更多。
从Demo到生产的鸿沟巨大。社区里的共识是:Agent在干净Demo里表现惊艳,在真实项目的“messy middle”(混乱的中间地带)里频繁崩。真实工程里大量边界条件、遗留代码、未文档化的业务规则,Agent缺乏上下文根本处理不了。
Fortune的另一篇报道抓住了这个矛盾:黄仁勋自己在斯坦福商学院说,Agents会“harass you, micromanage you”——骚扰你、事无巨细地管你。但它们带来的结果是“我们做事更快了,规模更大了,我们开始想那些以前根本不敢想的事情”。
所以“调度游戏”这个比喻很准。游戏玩得好是碾压级的生产力,玩得烂是被100个AI队友同时刷屏催更。
调度能力,将是下一个十年的核心分水岭
黄仁勋手里还有一张更长期的牌:物理AI。Agent不只会写代码,还会驱动机器人。
结合NVIDIA的Cosmos平台和Isaac GR00T机器人基础模型,数字Agent和具身机器人正在打通。一个在虚拟世界里调度代码Agent的工程师,和未来管理一组物理机器人的运营者,使用的是同一套编排逻辑。
教育体系首当其冲。大学的CS课程还在教循环和数据结构,而硅谷已经有人在喊“Agent Orchestration 101”该进大一必修课了。这个gap不仅存在,而且在加速扩大。
对个人的冲击同样凌厉。会调度100个Agent的顶级工程师,价值将暴增。只会passive prompting、等AI给答案的工程师,竞争力会迅速衰减。工作变得更像“AI项目经理加领域专家”——需要你懂技术深度,又需要你有管理宽度。
黄仁勋这盘棋里最狠的一手是:他不需要说服你相信Agent的未来。他只需要确保当Agent的未来发生时,所有计算都跑在NVIDIA的芯片、系统、软件栈上。从RTX Spark到Vera Rubin,从OpenClaw到NemoClaw,从Nemotron到Cosmos——每一层都锁死了。
而“每个工程师同时指挥100个Agent”这句话,既是愿景,也是通牒。
▲ X平台上的讨论:几百个Agent已在实战中使用,但记忆、编排、生产化路径仍是硬骨头(来源:X/@0xTrackMind)







