大数跨境
0
0

AI 大神 Karpathy 2025 年度总结刷屏:AI 既是天才也是智障,这 6 个转折最关键

AI 大神 Karpathy 2025 年度总结刷屏:AI 既是天才也是智障,这 6 个转折最关键 APPSO
2025-12-20
16
导读:行业甚至还没挖掘出 AI 潜力的 10%。
最近,OpenAI 前联合创始人 Andrej Karpathy 发布了他对大模型的年度总结,回顾了2025年AI技术的关键演进与行业洞察。

今年早些时候,他在 YC 的一场演讲引发广泛关注,提出多个前瞻性观点:
  • 软件 3.0 已来:从人工编码(1.0)、数据驱动训练(2.0),进入通过 Prompt“念咒语”操控模型的新时代。
  • LLM 是新操作系统:具备调度上下文(Context Window)和推理算力(CPU)的能力。
  • Agent 的十年路径:实现高可靠性 AI Agent 需要长期迭代,从99%到99.999%的稳定需十年积累。
Karpathy 在《2025 年度总结》中进一步剖析了这一年大模型智能的演化方向。以下为精译与解读。
2025 年既令人振奋,又充满挑战。
LLM 正在作为一种新型智能涌现,它比我预期的更聪明,也更笨拙。
尽管如此,其应用价值极高。当前行业尚未挖掘出其潜力的10%。领域依然广阔,创新空间巨大。
正如他此前所言:我们将持续见证快速进步,但前方仍有大量基础工作亟待完成。

1. RLVR:让AI学会“思考”

此前,大模型训练依赖三大步骤:
  • 预训练:让模型学习海量文本,掌握语言能力。
  • 监督微调(SFT):用人工标注数据指导回答方式。
  • 人类反馈强化学习(RLHF):由人对输出评分,优化表达风格。
2025年,这一范式迎来关键升级——引入RLVR(从可验证奖励中进行强化学习)
不再依赖主观评分,而是让AI处理有明确答案的任务(如数学题、编程),通过自动验证结果提供反馈。在百万次自我博弈中,模型自发发展出类似“推理”的行为:拆解问题、回溯检查,展现出类思维策略(参考 DeepSeek R1 论文)。

核心对比

旧范式(RLHF):如同教孩子写作文,缺乏标准答案,只能模仿语气。
新范式(RLVR):将AI投入奥数训练营,通过题目与对错反馈,自主摸索解题逻辑。
该方法消耗大量算力,成为2025年主要训练方向。结果是:模型规模未显著增长,但训练时间大幅延长,并实现了“延长思考时间”的新控制维度。OpenAI 的 o1 为起点,o3 成为真正拐点。

2. 幽灵 vs 动物:AI不是电子宠物

行业逐渐意识到,LLM 的智能形态并非生物式成长,而更像“召唤幽灵”——其认知结构完全不同于人类。
人类大脑为生存与繁衍优化;LLM 则为模仿文本、获取分数、赢得点赞而进化。

参差不齐的智能(Jagged Intelligence)

由于 RLVR 聚焦可验证任务,AI 在数学、编程等领域能力突飞猛进,形成“尖刺状”能力分布。
这导致一种矛盾现象:
  • 能秒解高等数学题;
  • 却易陷入简单逻辑陷阱。
Karpathy 引用一张广为流传的图示:人类智能呈圆润的蓝色圆圈,AI 智能则是布满尖刺的红色海胆图形,形象揭示其非均衡性。
这也解释了为何他对现有评测榜单失去信任。既然测试集可被验证,便可针对性训练,“刷榜”已演变为一门“应试艺术”。

3. Cursor:不只是编辑器,更是“包工头”

Cursor 的崛起表明:LLM 应用层远比想象中厚实。
人们开始设想“医疗界的 Cursor”、“法律界的 Cursor”,这类工具的核心角色包括:
  • 上下文工程师:整合背景资料并输入给模型;
  • 工头:后台调度多个模型协同工作,拆解任务并优化成本;
  • 遥控器:提供滑块调节 AI 自主程度。
预测:大模型实验室(如 OpenAI)培养“全科大学生”,应用开发商则将其组织成“专业施工队”,结合私有数据与工具落地场景。

4. Claude Code:驻留本地的“赛博幽灵”

Claude Code(CC)的出现标志着一个重要转向:AI 不再局限于云端交互,而是运行于用户本地设备
相比之下,OpenAI 的早期 Agent 多运行于云端,远离真实开发环境。而在当前“能力参差”的阶段,本地化才是关键。
代码、配置、密钥及复杂环境均存在于本地。Anthropic 将 AI 集成进命令行界面(CLI),使其成为寄宿在电脑中的“赛博幽灵”,随时响应操作。
这种模式跳脱浏览器限制,代表未来 AI 交互的主流形态。

5. Vibe Coding:意图驱动编程

“Vibe Coding”是作者提出的概念:无需掌握语法细节,只需用自然语言描述意图和感觉,由 AI 完成编码。

带来的变革

  • 对普通人:编程门槛彻底消失;
  • 对专家:代码变得廉价、一次性、即用即弃。
例如,为排查 Bug 可让 AI 即时生成专用测试 App,使用后删除。在过去难以想象的行为,在2025年已成为常态——代码近乎免费。
Vibe Coding 将重塑软件开发流程,并重新定义程序员岗位职责。

6. Nano Banana:迈向大模型GUI新时代

当前 AI 交互仍以文本输入为主(如 ChatGPT),如同使用 DOS 命令行,反人类体验明显。
计算机偏好文本,但人类是视觉动物,更倾向图像、表格、视频等表达形式。
Google Gemini 的“Nano Banana”(代指多模态交互模型)预示了未来 LLM GUI 的形态:AI 不应只输出文字,而应直接生成图表、网页或交互面板
这不仅是“画图”,更是文本生成、逻辑推理与视觉呈现深度融合的能力体现,标志着下一代人机交互范式的开启。
【声明】内容源于网络
0
0
APPSO
AI第一新媒体,「超级个体」的灵感指南。 #AIGC #智能设备 #独特应用 #Generative Al
内容 14431
粉丝 0
APPSO AI第一新媒体,「超级个体」的灵感指南。 #AIGC #智能设备 #独特应用 #Generative Al
总阅读117.9k
粉丝0
内容14.4k