
新智元报道
编辑:元宇
【新智元导读】顶尖模型能重构10万行代码,却会建议走路去50米外洗车店?Karpathy剖析AI锯齿状智能现象:能力分布不均源于可验证性与经济激励,Vibe Coding抬高编程门槛,专业开发者需转向智能体工程。智能体时代,可外包思考,但理解不可替代。
AI锯齿状能力的本质
当今顶尖大模型可重构10万行代码,却在建议"走路去洗车"等常识问题上犯错。Karpathy在Sequoia AI Ascent 2026演讲中指出,这种"锯齿状智能"(jaggedness)体现能力分布不均:模型在特定领域如超人,基础场景却似实习生。关键点在于避免"可行/不可行"的二元判断。
2026年4月29日,Karpathy在Sequoia AI Ascent 2026现场强调:AI非简单加速既有工具,而是开辟新地平线。
软件发展的三大新地平线
Karpathy以自研应用MenuGen为例:旧范式需OCR加图像生成,而智能体版本只需向Gemini发送"用Nanobanana贴菜品图"指令。AI直接输出结果,压缩工程复杂度。
范式转变的三大方向
1. 功能直接实现:原需完整工程的任务(如菜单图示化)转化为单步指令输出。
2. .md取代.sh:安装指南从易崩坏的bash脚本转向Markdown指令,由智能体自主调试环境。
3. LLM Wiki知识工程:区别于普通RAG的零散检索,LLM Wiki通过Markdown文件夹持续维护可版本控制的知识库,Obsidian作为"IDE"管理工程化知识。
软件1.0重代码编写,2.0重权重训练,3.0则聚焦提示词设计、上下文控制与智能体调度。
锯齿状智能的经济学逻辑
能力分布不均本质是"可验证性"与"市场规模"共同作用:
- 强化学习依赖可验证反馈(代码执行/答案正确性);
- 商业回报驱动数据投入:高付费领域(如编程)被优先优化,低价值场景易出现常识错误。
Karpathy比喻:在RL轨道上模型飞速进化,离开数据分布则"持刀进丛林"。创业者应切入可验证但未被巨头覆盖的细分领域,构建自有强化学习环境以建立护城河。
Vibe Coding后的智能体工程
作为Vibe Coding(2025年度热词)提出者,Karpathy进一步指出:
- Vibe Coding抬升开发"地板",使大众可参与软件构建;
- 但专业开发需转向"智能体工程"以守住"天花板"。
实证显示,AI生成代码常臃肿脆弱(如用临时邮箱匹配用户),需专业开发者掌控系统架构与安全校验。智能体如同"实习生"——能辅助执行,却不可独立上线生产代码。未来竞争力不在编码速度,而在对智能体的有效管理。
不可外包的核心能力
Karpathy重申核心观点:"可外包思考,但不能外包理解"。人类必须承担六项关键职能:
- 需求定义(Spec)与计划拆解(Plan)
- 系统架构(Architecture)设计
- 方案审美判断(Taste)
- 过程监督(Oversight)与结果验证(Verification)
延续"动物与幽灵"理论,智能体是数据驱动的"幽灵"(无内在动机),人类应定位为"工程导演":不必写代码,但需深刻理解产品本质与边界。神经网络或成主进程,但导演职责永恒——定义"真正需要什么"。
行业趋势显示,顶尖AI公司人均产值已破百万美元。成功关键在于构建能发挥智能体价值的导演型团队。

