鹭羽 发自 凹非寺
量子位 | 公众号 QbitAI
离职的LeCun公开指出:Llama 4在基准测试中存在结果篡改问题——团队对不同测试使用了不同模型。
结果的确被篡改了一点。
为了更好的结果,团队对不同基准测试使用了不同的模型。
田渊栋也在个人年终总结中透露,自己是被临时抽调参与Llama 4“救火”,原计划应对四种技术路径,最终却遭遇小扎提出的第五种方案。
明明是被拉来给Llama4救火的,事先预想了四种可能,结果小扎给了我第五种……
两位资深AI科学家在离职后均宣布创业。
Llama4刷榜引发的离职潮
DeepSeek的快速崛起加剧了Meta内部压力,Llama 4尚未发布即被业界视为落后,迫使小扎大幅追加AI投入。
LeCun证实,小扎因此强化内部Push节奏,要求GenAI部门加速开发与落地,并紧急调派田渊栋团队接手Llama 4项目。
但研发理念冲突明显:LeCun团队倾向探索创新方向,而管理层更聚焦可快速部署的技术路线。
真正导火索是Llama 4在公开排行榜中被证实存在数据操作行为,导致声誉严重受损,小扎随即失去对原有团队的信任并启动大规模人事调整。
Meta一边高薪从硅谷广招新人,一边裁撤长期骨干,田渊栋团队成为首批受影响者:1月仓促接手,10月Llama 4.5训练完毕即被边缘化。
面对仅剩两个月的发布周期和大量遗留工作,田渊栋团队曾系统评估四种可能结局,但最终执行方案未被采纳,团队全员被移出项目。
这也让我对这社会的复杂性有了更为深刻的认识。
尽管经历波折,田渊栋团队仍在强化学习与大模型推理领域取得进展:包括连续隐空间推理(coconut)、Reasoning by Superposition理论深化、Token Assorted、DeepConf、ThreadWeaver等提升推理效率的方法,以及围绕Grokking现象开展的可解释性研究。
相较田渊栋的克制,LeCun对Meta提出尖锐批评,指出其过度依赖大语言模型,尤其质疑新组建的超级智能实验室成员缺乏科研经验与协作能力。
他强调LLM受限于语言建模本质,“是死胡同”,实现人类水平智能必须构建理解物理世界的世界模型——而这正是Meta已放弃的方向。
离开Meta做点啥?创业
LeCun创立新公司Advanced Machine Intelligence(AMI),专注开源世界模型研发,采用V-JEPA架构,目标是通过视频与空间数据学习,赋予AI规划、推理与长期记忆能力。
LeCun将担任执行主席而非CEO,日常管理由Nabla联合创始人Alex LeBrun负责。
他预计V-JEPA初始版本将在12个月内推出,并在未来数年持续推进,虽距AGI仍有距离,但被视为通往通用人工智能的关键路径之一。
田渊栋亦拒绝多家大厂邀约,正式宣布创业,目前暂未披露具体方向,仅表示将作为联合创始人开启新阶段。
乘着自己还年轻,去当一家新初创公司的联合创始人。

