AI暴力时代,他选择打开黑箱
过去三年的AI领域,弥漫着一种“暴力”气息:算力暴力、数据暴力、参数暴力。Scaling Law成为行业信仰,“大力出奇迹”几乎等同于唯一路径。
而田渊栋却走上了一条更冷静、更底层的道路。
作为Meta FAIR前资深首席研究员,LLaMA与OpenGo的核心推动者,他的研究始终聚焦一件事:打开大模型的黑箱,寻找智能涌现的物理机制与底层逻辑。
三个月前,他离开效力11年的Meta。春节前夕,我们在硅谷深入对话,探讨其成长轨迹、对Transformer架构的根本性质疑、“费米线”理论、大厂组织病变,以及人类在AI奇点临近时的独特价值。
5个核心判断
- AI正在划定一条不断上移的“费米线”:线下重复性技能因AI无限供给而价值趋零;唯有具备不可替代创造力、能解决深层难题的人,才能持续立足。
- 硅谷巨头陷入严重“组织病变”:层层汇报机制导致高层脱离真实技术进展;激进目标只能靠底层“Hack”与泡沫维系。
- Transformer已近十年未变,修修补补无意义:算法进化不存在中间态;线性注意力无法替代全注意力;下一代架构必须彻底重构。
- 盲目堆砌算力是偷懒:真正突破在于“打开黑箱”,理解智能涌现背后的物理机制与数学原理。
- 梯度下降与概率预测模型或永远无法模拟“顿悟”:实现人类水平智能,可能需彻底替换整个训练范式。
人与成长
Creekstone:请简要介绍您的成长与职业经历?
田渊栋:上海人,本科毕业后在北京微软亚洲研究院实习,由此萌生出国念头。2008年赴卡内基梅隆大学攻读博士,2013年毕业。先后就职于谷歌无人车团队、Meta(近11年),主导或深度参与围棋Bot(OpenGo)、强化学习优化、大模型可解释性、LLaMA系列、推理效率提升等关键项目。
Creekstone:您的MBTI类型是?
田渊栋:倾向INTP或INTJ,确定的是I型(内向)。早年极度内向,上台讲话会紧张失语;后经长期锻炼,逐步掌握表达能力,并体会到交流的价值——这本身即是一次世界观升级。
Creekstone:中美科研环境对您性格塑造有何影响?
田渊栋:国内环境二元化明显:“好学生”被期待沉默务实;“能说会道”则归为另一类。负向激励多、正向反馈少,抑制探索欲。美国环境更包容多元特质,I/E可共存;正向激励丰富,焦虑感更低。这种转变,让他从“埋头做事者”成长为“既能思考、也能表达”的研究者。
Creekstone:您最喜爱的书籍与电影?
田渊栋:《三体》第二部《黑暗森林》对其影响至深,其主导的围棋AI项目即以此命名。也广泛阅读《深渊上的火》《最后的问题》《冰与火之歌》《诡秘之主》《道诡异仙》等科幻与奇幻作品。影视偏好《攻壳机动队》《反叛的鲁路修》等思想性强、叙事精良的动画。
Creekstone:是否有类似《黑暗森林》那样重塑您世界观的经历?
田渊栋:从极致内向到敢于表达,是最关键的转折。当第一次演讲获得认可,他意识到:想法只有被理解、被传播,才产生真实影响力。若仅埋头苦干而不沟通,个人上限将受限。
Creekstone:文学创作会被AI取代吗?
田渊栋:不会。文学的起点是“人有表达冲动、有感动瞬间、愿将意义传递他人”。AI可润色、可续写,但无法替代真实作者的生命体验与情感动机。作品的灵魂,在于作者为何而写、角色与自身的关系、选择背后的价值追问——这些立住了,AI辅助才有意义。
打开黑箱,理解本质
Creekstone:您横跨CV、强化学习、大模型等领域,贯穿始终的驱动力是什么?
田渊栋:打开黑箱,发现底层机制。OpenGo复现AlphaZero,是为了理解“自对弈如何让AI自我进化”;研究自监督表征,是追问“特征如何习得、何时塌缩”;剖析Attention与FFN层,则直指“涌现现象如何发生”。所有应用创新——如Attention Sink、Length Interpolation——均源于对机制的洞察。
Creekstone:在“Scaling Law”主流下坚持白盒化研究,是否感到孤独?资源是否受限?
田渊栋:作为I型人格,独处即能量来源。研究本身带来内在满足,无需外部认同。过度追逐热点反而丧失章法;但完全隔离亦易被时代抛弃。关键是尊重群体智慧,把握大趋势中的真问题。
Creekstone:如何平衡工程落地与第一性原理探索?
田渊栋:方法是“把工程问题数学化”。例如将蒙特卡洛树搜索(MCTS)拓展至黑盒优化、神经架构搜索(NAS)等场景,先建模、再求解。大模型研发虽节奏快、偏“Hacky”,但只要在关键节点注入理论亮点,就足以支撑深度演进。
大厂围城与人性的价值
Creekstone:在CMU、谷歌、Meta FAIR等实战导向环境中,有何观察?
田渊栋:2022年前的Meta FAIR自由宽松;大模型热潮后,演变为资源争夺战——卡即权力,政治摩擦加剧。2023年起已有离职念头;虽因推理模型再度受重视,终仍选择离开。当前大厂节奏失控:VP任期缩至数月,压力层层传导,容错空间消失。
Creekstone:快速变化与巨额投入,催生哪些共性组织问题?
田渊栋:首要问题是长期研究被边缘化——公司押注短期胜出,无暇深耕基础。其次,信息在多层VP传递中严重失真:“报喜不报忧”导致高层误判形势,制定不切实际目标;基层被迫用“Hack”或夸大应对,形成恶性循环。这不是个体问题,而是组织架构缺陷。
Creekstone:AI逼近奇点,人性价值何在?
田渊栋:“独一无二”是核心价值。2023年他在知乎提出:你的目标、理想、追求与众不同,别人才视你为不可替代。AI压缩执行层,但“做深不做浅”“有品味、有坚持、解难题”的人,反而更稀缺。
他于2026年初提出“费米线”概念:AI能力线以下的工作价值趋零;线上者越少,价值越高;该线随AI进步持续上移。唯有做真正热爱之事,才可能攀至AI之上——若做非所爱,上限注定被取代。
智能的本质与未来
Creekstone:创造力与共情能否被Transformer框架真正量化、参数化?
田渊栋:低阶创新(如工具迁移)AI可胜任;高阶创新依赖对抽象概念的深刻理解,AI目前迁移能力薄弱。斯坦福“AI Scientist”研究显示,AI生成想法新颖性超人,但常流于表面拼接;人类因理解本质关联,更能产出有意义突破。二者创新逻辑不同,难言高下。
Creekstone:当前推理是否缺乏因果与高阶抽象指导?
田渊栋:数据足够时,概率滑行或仍有效;但人类专家凭少量样本即可抓住本质,AI远未达此水平。
Creekstone:Yann LeCun的World Model能否破局?
田渊栋:尚未触及根本。其仍基于梯度下降,损失函数设计甚至可追溯至他2021年关于网络动力学的研究。若要实现人类级智能,训练算法本身或需被彻底替换。
Creekstone:如何看待线性注意力与Test-Time Training?
田渊栋:线性注意力本质是动态联想记忆,但存在能力上界。人类学习存在“记忆→理解→顿悟”的跃迁,能模糊细节、保留思路;当前模型仅停留于事实记忆,且易遗忘。全注意力因保留全部KV cache,在复杂多跳推理中不可替代。
Creekstone:新架构设计如何协同硬件?
田渊栋:硬件协同至关重要。Grok等架构通过紧耦合SRAM与计算单元提升推理效率,核心在于解耦计算与内存IO瓶颈。英伟达亦在主动革新自身架构,以防被颠覆。
Creekstone:如何解决神经网络“灾难性遗忘”?
田渊栋:记忆分层:权重是慢速记忆,上下文窗口是快速记忆。结合可解释性研究(底层编码简单语义、中层处理复杂概念、高层解码输出),有望将分层理解融入持续学习,开辟新路径。
Creekstone:如何从第一性原理理解Agent的记忆设计?
田渊栋:实用Agent需兼顾效率与效果:一层关键词匹配实现快速响应,一层向量语义检索保障精准回溯。结构化存储(如文件系统)可视作“工具使用”——Agent动态调用最相关信息入上下文,本质仍是工具链延伸。
Creekstone:OpenClaw等Agent框架是否实现跨Session持续进化?
田渊栋:MCTS+强化学习是更深层自进化方向,但需权衡成本:从弱基线起步代价极高。工程方案与根本探索应双轨并进。
Creekstone:您会使用OpenClaw这类Agent产品吗?
田渊栋:曾尝试安装,但因安全顾虑放弃。“小儿持千金于闹市”——Agent掌握全部API密钥与权限,一次失误即致泄露。他倾向用AI辅助自己编码,构建可控系统;亦警惕第三方Skills中潜藏恶意代码。
开源的价值、AGI的瞬间与未来展望
Creekstone:Meta策略转向闭源,开源在AI进化中价值是否改变?
田渊栋:开源是一种态度,而非固定策略。Meta早期开源是良性循环:以顶尖模型吸引人才,反哺下一代研发。策略调整属企业自主权。但社会层面,开源至关重要——它降低技术门槛,促进公平竞争,缓解“唯闭源马首是瞻”的焦虑。多数任务无需SOTA模型,优质开源方案已足够。
Creekstone:是否有让您感到AGI迫近的“奇点时刻”?
田渊栋:无恐惧,但有深刻体感:近两三个月,AI编码已从IDE嵌入走向命令行自然语言交互。这不同于AlphaGo带来的旁观式震撼,而是工作流与思维模式的实时重构——变革已悄然发生。
Creekstone:您的“北极星”是什么?希望退休时如何被定义?
田渊栋:首要愿望是成为“发现大模型底层法则的科学家”。写作是重要爱好,愿发表优质小说,但非主业目标。
Creekstone:对中国开发者与年轻创业者有何寄语?
田渊栋:这是“千年未有之大变局”。一毕业即遇技术爆发期,务必珍惜时间,专注做自己真正想做的事,打造让人由衷赞叹的“好产品”。


