大数跨境
0
0

LeCun 手撕 Meta:Llama 4 造假,小扎直接废掉整个 AI 团队,锐评 28 岁新上司:不懂研究还瞎指挥

LeCun 手撕 Meta:Llama 4 造假,小扎直接废掉整个 AI 团队,锐评 28 岁新上司:不懂研究还瞎指挥 AI前线
2026-01-03
12
导读:去年这个时候,外界普遍传言:图灵奖得主、Meta 前首席科学家 Yann LeCun 将主动离开 Meta,寻求新的研究机会。
整理 | 华卫

去年底,外界盛传图灵奖得主、Meta前首席科学家Yann LeCun将离职;如今他已正式官宣创业。但近期一场长达三小时的深度专访,却揭开了更深层的组织裂痕:Llama 4基准测试结果被人为操纵、AI团队遭系统性边缘化,以及LeCun因拒绝为存在科学缺陷的技术方案背书而最终出走 [2]

篡改模型测试结果后,小扎边缘化所有参与员工

LeCun证实,Llama 4的部分基准测试结果存在“掺假”行为——工程师针对不同测试任务,刻意选用不同变体模型以优化分数,而非反映真实能力 [3] 。这一操作源于ChatGPT于2022年11月问世后Meta的战术失措:公司仓促重组生成式AI业务,密集推出Llama 2、Llama 3,并以“开源领军者”姿态对标OpenAI封闭路线,借渠道分发与生态建设赢得显著渗透率 [4]

然而2025年4月发布的Llama 4虽在评测中数据亮眼,实际表现却广受质疑。独立报道已佐证LeCun所述“数据作弊”现象——即按测试类型动态切换模型配置 [5] 。该事件直接导致扎克伯格对整个生成式AI团队丧失信任,“基本上对所有参与此事的人都失去了信任”,进而致使该团队被整体边缘化,大量核心成员离职或即将离职 [6]

作为应对,Meta于2025年6月斥资约150亿美元收购数据标注公司Scale AI大量股份,并高调聘请其28岁CEO Alexandr Wang牵头组建全新TBD实验室,专攻前沿AI模型研发 [7] 。此外,公司还发起大规模挖角行动,向竞对顶尖研究员开出最高1亿美元签约奖金 [8] 。此类超常规投入,折射出其战略押注正面临动摇风险 [9]

LeCun锐评Alexandr Wang:毫无经验、休想对我指手画脚

Wang的任命引发架构层面的剧烈倒置:身为卷积神经网络发明者、深度学习奠基人之一的LeCun,竟需向一位主业为数据标注的年轻管理者汇报。这种身份错位,在任何严肃研究机构都极为罕见 [10]

LeCun直言,Wang“毫无研究经验,既不懂研究该如何开展,也不知道研究该如何落地”,尽管“学得很快,也清楚自身短板”,但其管理背景与科研范式存在根本隔阂 [11] 。当被问及汇报关系时,LeCun回应谨慎而坚定:“没人能对研究员指手画脚。尤其像我这样的研究员,更是绝无可能。”他强调,Wang虽曾短暂担任其上级,但从未对其工作发号施令 [12]

更深层矛盾在于技术理念分歧:Wang代表Meta全力押注的大模型规模化路线,而LeCun认为该范式已触及本质瓶颈。让奉行此路线者执掌AI研究中枢,直接消解了其留任基础 [13] 。“我敢肯定,Meta内部有不少人,或许也包括Alex,都巴不得我不要对外宣称:在通往超级智能的道路上,大语言模型本质上已是一条死胡同。”LeCun重申,“但我不会因为某个家伙说我错了,就改变自己的想法。我没有错。作为一名科学家,我的职业操守不允许我做出这种违心之举。” [14]

“语言模型已经达到瓶颈”

当前Meta的AI战略,是沿用OpenAI联合创始人已公开承认触及天花板的架构路径,与之正面对垒 [15] 。但作为公司最具声望的AI科学家,LeCun指出,该方案无法实现Meta所宣称的智能目标;旗舰模型团队交付成果可信度极低,进一步加剧管理层信任崩塌 [16]

LeCun对大语言模型(LLM)的批判早已超越个案,上升至方法论层面:语言作为信息载体,存在固有带宽限制,难以支撑真正智能的涌现 [17] 。他在Lex Fridman播客中测算,人类通读互联网全部文本需17万年,而四岁儿童单靠视觉输入接收的信息量已达10¹⁵字节——约为LLM从全网语料中提取内容的50倍 [18]

这揭示了根本性差异:训练LLM如同“仅通过阅读所有木工书籍学习木工”,却不曾触碰一把锤子;掌握术语不等于理解物理原理。LeCun的结论简洁有力:“要学好木工,你必须亲手挥起锤子。” [19] 正因缺乏因果建模与具身交互,LLM在青少年20小时即可掌握的驾驶、幼儿首次尝试即会的清洁、家猫自如穿梭三维空间等任务上,仍远逊于生物智能 [20]

这一判断正获得范式开创者印证:2025年11月,OpenAI前首席科学家Ilya Sutskever在接受Dwarkesh Patel采访时明确表示,行业正从“规模化时代”迈入“研究时代”,单纯依赖算力堆叠已显边际效益递减 [21] 。当规模化路径的奠基者主动转向,围绕LLM的行业共识正在瓦解 [22]

新架构一年内有雏形?

LeCun以“掐人一下引发退缩反应”为例说明:真正的因果理解,源于心智模型基于预判产生的行为反馈与情绪更新;而LLM仅做统计符号预测,缺失物理世界建模能力 [23]

为此,他提出联合嵌入预测架构(JEPA),一种面向视频与空间数据的世界模型框架。该架构旨在培养AI基于物理规律的认知能力,学习行为相关的抽象表征,而非拘泥于符号预测;并引入可随经验演化的持久记忆机制,取代每次对话即清空的短期状态 [24]

LeCun给出明确时间表:JEPA雏形将在12个月内推出,数年内实现规模化部署 [25] 。其新创公司“先进机器智能”(AMI)将聚焦该路径,他本人出任执行董事长,而非CEO——“我是一名科学家,一个有远见的人。我能激励人们去做有趣的事情。我很擅长预测哪种技术会成功,哪种会失败。但我当不了CEO。我既太缺乏条理,也太老了!” [26]

他预测:具备动物级智能的AI将在5–7年内实现,人类级智能则需约10年 [27] 。这位深度学习范式的缔造者,正以彻底颠覆而非渐进改良的姿态,押注下一轮AI革命的技术奇点 [28]

【声明】内容源于网络
0
0
AI前线
面向AI爱好者、开发者和科学家,提供大模型最新资讯、AI技术分享干货、一线业界实践案例,助你全面拥抱AIGC。
内容 8040
粉丝 0
AI前线 面向AI爱好者、开发者和科学家,提供大模型最新资讯、AI技术分享干货、一线业界实践案例,助你全面拥抱AIGC。
总阅读60.6k
粉丝0
内容8.0k