Karpathy亲述:深度使用AI智能体的工作变革与挑战
新智元报道 编辑:好困 Aeneas
【新智元导读】Karpathy自曝陷入AI精神错乱:五个月前称智能体"根本不好使",如今却每天16小时指挥AI智能体,焦虑于未将token用至极限。
前OpenAI联合创始人、特斯拉AI总监Karpathy近期在播客中坦言,自去年12月起其工作模式发生根本性转变——手写代码与AI智能体协作比例从80/20逆转为20/80。每天16小时专注于向智能体下达指令,已处于"精神错乱边缘"。
智能体工作模式的颠覆性转变
这一转变源于2025年12月的技术突破:Claude和Codex跨过任务连贯性阈值。软件工程师的默认工作流彻底重构,工程师的屏幕不再显示代码编辑器,而是并行运行多个负责不同任务的Agent。这实质是人类角色的转变——从代码编写者进化为AI团队管理者。
Karpathy描述其当前状态:一旦等待Agent完成任务,第一反应即是"能否再开启新Agent"。这种对系统扩展极限的持续探索形成新型焦虑,"甚至因未用完token而感到不安",形成"反馈周期缩短-刺激增强"的成瘾循环。
性格因素对智能体效率的关键影响
Karpathy强调技术圈忽略的重要维度:智能体的"性格"。Claude因具备"队友感"而显著优于Codex:它会对创新想法给予正向反馈,甚至引发用户"试图赢得Claude夸奖"的互动。OpenClaw开发中同样验证,精心设计的性格设定文件(soul.md)能有效提升协作效率。
智能体实际应用突破
家庭智能场景:Dobby管家
Karpathy构建的Claude智能体"Dobby"通过三句自然语言指令完成全屋控制:扫描网络接入Sonos音响、联动灯光空调等六类设备,并实现"多比,睡觉时间到了"自动关灯等跨系统操作。核心价值在于取代传统智能家居App,验证了"API端点直连智能体"的未来架构可行性。
科研场景:AutoResearch系统
在3月的实验中,Karpathy将模型训练代码交由智能体优化。700次实验后发现20项有效改进(包括QK Norm与RoPE顺序调整等架构级优化),叠加后大模型训练速度提升11%。关键突破在于:智能体识别出Adam优化器betas参数未充分调优等人类忽视的交互效应,实质实现了对"科研即搜索最优解"的自动化。
该项目引发行业共振:Shopify CEO实现37次实验19%性能提升,SkyPilot团队在16 GPU集群上发现并行化催生的非贪心搜索策略。Karpathy预测将出现分布式实验网络,公众可通过算力捐赠参与特定领域(如癌症研究)的智能体协作。
技术局限与发展方向
Karpathy指出当前智能体存在"参差不齐"的能力分布:能在系统编程等受训领域高效运作,却在需要判断力的场景暴露缺陷。根源在于强化学习仅优化可验证任务(如代码运行),却缺乏对意图揣摩场景的训练信号。
其GitHub预言2026年将迎来"slopacolypse"(低质内容泛滥期),但真正生产力提升与"表演型应用"将并存。从五个月前否定智能体到当前"无法停止"的工作状态,标志着人类角色正从执行者向指令设计师加速转变。


