大数跨境
0
0

为什么 OpenAI、DeepMind、DeepSeek,突然都在“拆大模型的大脑”?

为什么 OpenAI、DeepMind、DeepSeek,突然都在“拆大模型的大脑”? AI技术研习社
2026-01-18
13
导读:未来真正淘汰人的,不是 AI,而是那些始终用“旧结构理解新智能”的人。

AI竞争已进入“智能结构”时代

近期密集研读论文、访谈与内部分享后,我意识到一个关键问题:许多人正用“上一代AI的认知”,理解“下一代AI的竞争”。本文不堆砌新名词,而是梳理OpenAI、DeepMind、DeepSeek三条主线,帮你构建一张清晰的AI发展结构图。

读完你将明确三点:

  • 当前大模型真正的瓶颈所在;
  • 为何业界普遍转向“拆解大脑”式架构设计;
  • 作为普通技术人,应关注位置选择,而非追逐版本号。

核心判断:本轮AI竞争的核心矛盾,已从“够不够聪明”,转向“有没有稳定的智能结构”。

参差不齐的智能:大模型的结构性缺陷

当前大模型表现极不稳定——状态好时如开挂,状态差时逻辑混乱;同一问题换提示词,结果天差地别;短任务稳健,长任务频出幻觉。DeepMind创始人Demis Hassabis将其精准定义为“参差不齐的智能(jagged intelligence)”。

这一概念直击本质。例如某Agent项目上线初期演示惊艳,一周后却频繁出现逻辑严谨性缺失、关键约束遗漏、前后自相矛盾等问题。调参与优化提示词收效甚微——这不是工程缺陷,而是底层结构失配:模型的“大脑”本就不适合承担复杂规划与持续执行任务。

OpenAI:从聊天工具到行动主体

GPT-5.2-Codex的真正突破,不在代码能力或安全性的提升,而在于它开始具备“能干活的工程师”特质。

所谓“干活”,是指:

  • 接收模糊需求;
  • 自主拆解子任务;
  • 按阶段调用工具;
  • 容错并持续推进;
  • 最终交付完整结果。

支撑该能力的,是Agentic Workflows——模型首次被当作“行动主体”,而非被动响应的聊天工具。

DeepMind:以世界模型重构认知基础

DeepMind押注“世界模型(World Model)”,并非追求更炫的生成效果,而是解决根本性瓶颈:若AI无法理解世界如何运作,就永远困于文本统计层面。

它可写方案、可解释结论,但面对以下任务即暴露短板:

  • 长期规划;
  • 物理因果推理;
  • 真实环境变化预测。

因此,其视频建模与交互模型并非内容工具,而是世界模型的胚胎——能生成世界,意味着至少在结构层面理解了世界。

DeepSeek:分离记忆与推理,释放结构红利

DeepSeek提出的Engram架构,直指主流大模型的根本矛盾:为何必须将“知识存储”与“推理能力”强行耦合于同一神经网络?

为什么一定要把“推理能力”和“知识存储”,硬塞进同一张神经网络里?

当前Dense/MoE架构中,知识与推理混于专家层,导致两大问题:

  • 大量参数用于静态事实存储;
  • 网络浅层被迫承担模式重建,深层计算潜力被浪费。

Engram方案彻底解耦:

  • MoE主干:专注动态推理与理解;
  • Engram模块:专用静态知识检索,支持O(1)条件索引(非向量相似搜索),可预载入CPU内存加速访问。

类比而言:传统模型如死记硬背者,越聪明越疲惫;Engram则如“大脑思考 + 书架存书”——提问即定位第几排第几本。

效果显著:

  • BBH推理 +5.0;
  • MATH +2.4;
  • 代码能力 +3.0。

这不是训练增量带来的提升,而是源于架构解耦的“结构红利”:释放推理网络负担后,单位参数效能与思考深度同步增强。

三大路线汇成“电子脑”完整结构

回看三条路径,轮廓清晰:

  • OpenAI补足行动能力(Agent);
  • DeepMind构建世界理解(World Model);
  • DeepSeek强化长期记忆(Engram)。

三者共同构成具备记忆、理解世界、规划行动的完整“电子脑”。这已不是单点模型升级,而是AI作为技术物种的结构性跃迁。

对从业者的启示:站在正确的神经系统上

你无需亲手造大脑,但必须选择适配未来智能结构的技术栈。

工程师应:

  • 少纠结参数规模,多理解模块化结构;
  • 重点关注Agent、Memory、Tool三者的协同机制。

产品与创业者应:

  • 摒弃“一个Prompt解决一切”的思路;
  • 转向设计含长期任务、状态管理、记忆流的产品架构。

内容创作者与研究者应:

  • 不止复述发布会信息;
  • 深入阐释“结构演进”的动因与影响。

未来真正淘汰人的,不是AI本身,而是那些始终用“旧结构认知”理解“新智能范式”的人。每一轮技术革命淘汰的,从来不是不会用工具的人,而是看不懂方向的人。

当前恰是普通技术人重新站队、重新理解、重新下注的关键窗口期。

【声明】内容源于网络
0
0
AI技术研习社
1234
内容 180
粉丝 0
AI技术研习社 1234
总阅读6.6k
粉丝0
内容180