AI能改10万行代码，却让你走路去洗车！Karpathy戳破「锯齿状智能」- 大数跨境

新智元

2026-05-01

新智元报道

编辑：元宇

【新智元导读】顶尖模型能重构10万行代码，却会建议走路去50米外洗车店？Karpathy剖析AI锯齿状智能现象：能力分布不均源于可验证性与经济激励，Vibe Coding抬高编程门槛，专业开发者需转向智能体工程。智能体时代，可外包思考，但理解不可替代。

AI锯齿状能力的本质

当今顶尖大模型可重构10万行代码，却在建议"走路去洗车"等常识问题上犯错。Karpathy在Sequoia AI Ascent 2026演讲中指出，这种"锯齿状智能"（jaggedness）体现能力分布不均：模型在特定领域如超人，基础场景却似实习生。关键点在于避免"可行/不可行"的二元判断。

2026年4月29日，Karpathy在Sequoia AI Ascent 2026现场强调：AI非简单加速既有工具，而是开辟新地平线。

Karpathy以自研应用MenuGen为例：旧范式需OCR加图像生成，而智能体版本只需向Gemini发送"用Nanobanana贴菜品图"指令。AI直接输出结果，压缩工程复杂度。

1. 功能直接实现：原需完整工程的任务（如菜单图示化）转化为单步指令输出。

2. .md取代.sh：安装指南从易崩坏的bash脚本转向Markdown指令，由智能体自主调试环境。

3. LLM Wiki知识工程：区别于普通RAG的零散检索，LLM Wiki通过Markdown文件夹持续维护可版本控制的知识库，Obsidian作为"IDE"管理工程化知识。

软件1.0重代码编写，2.0重权重训练，3.0则聚焦提示词设计、上下文控制与智能体调度。

能力分布不均本质是"可验证性"与"市场规模"共同作用：

- 强化学习依赖可验证反馈（代码执行/答案正确性）；

- 商业回报驱动数据投入：高付费领域（如编程）被优先优化，低价值场景易出现常识错误。

Karpathy比喻：在RL轨道上模型飞速进化，离开数据分布则"持刀进丛林"。创业者应切入可验证但未被巨头覆盖的细分领域，构建自有强化学习环境以建立护城河。

作为Vibe Coding（2025年度热词）提出者，Karpathy进一步指出：

- Vibe Coding抬升开发"地板"，使大众可参与软件构建；

- 但专业开发需转向"智能体工程"以守住"天花板"。

实证显示，AI生成代码常臃肿脆弱（如用临时邮箱匹配用户），需专业开发者掌控系统架构与安全校验。智能体如同"实习生"——能辅助执行，却不可独立上线生产代码。未来竞争力不在编码速度，而在对智能体的有效管理。

Karpathy重申核心观点："可外包思考，但不能外包理解"。人类必须承担六项关键职能：

- 需求定义（Spec）与计划拆解（Plan）

- 系统架构（Architecture）设计

- 方案审美判断（Taste）

- 过程监督（Oversight）与结果验证（Verification）

延续"动物与幽灵"理论，智能体是数据驱动的"幽灵"（无内在动机），人类应定位为"工程导演"：不必写代码，但需深刻理解产品本质与边界。神经网络或成主进程，但导演职责永恒——定义"真正需要什么"。

行业趋势显示，顶尖AI公司人均产值已破百万美元。成功关键在于构建能发挥智能体价值的导演型团队。

【声明】内容源于网络

新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

内容 15944

粉丝 0

新智元智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

总阅读181.3k

粉丝0

内容15.9k