大数跨境
0
0

LeCun曝Meta作弊刷榜,田渊栋:我没想到这个结局

LeCun曝Meta作弊刷榜,田渊栋:我没想到这个结局 量子位
2026-01-04
13
导读:田渊栋创业官宣
鹭羽 发自 凹非寺
量子位 | 公众号 QbitAI

离职的LeCun公开指出:Llama 4在基准测试中存在结果篡改问题——团队对不同测试使用了不同模型。

结果的确被篡改了一点。
为了更好的结果,团队对不同基准测试使用了不同的模型。

田渊栋也在个人年终总结中透露,自己是被临时抽调参与Llama 4“救火”,原计划应对四种技术路径,最终却遭遇小扎提出的第五种方案。

明明是被拉来给Llama4救火的,事先预想了四种可能,结果小扎给了我第五种……

两位资深AI科学家在离职后均宣布创业。

Llama4刷榜引发的离职潮

DeepSeek的快速崛起加剧了Meta内部压力,Llama 4尚未发布即被业界视为落后,迫使小扎大幅追加AI投入。

LeCun证实,小扎因此强化内部Push节奏,要求GenAI部门加速开发与落地,并紧急调派田渊栋团队接手Llama 4项目。

但研发理念冲突明显:LeCun团队倾向探索创新方向,而管理层更聚焦可快速部署的技术路线。

真正导火索是Llama 4在公开排行榜中被证实存在数据操作行为,导致声誉严重受损,小扎随即失去对原有团队的信任并启动大规模人事调整。

Meta一边高薪从硅谷广招新人,一边裁撤长期骨干,田渊栋团队成为首批受影响者:1月仓促接手,10月Llama 4.5训练完毕即被边缘化。

面对仅剩两个月的发布周期和大量遗留工作,田渊栋团队曾系统评估四种可能结局,但最终执行方案未被采纳,团队全员被移出项目。

这也让我对这社会的复杂性有了更为深刻的认识。

尽管经历波折,田渊栋团队仍在强化学习与大模型推理领域取得进展:包括连续隐空间推理(coconut)、Reasoning by Superposition理论深化、Token Assorted、DeepConf、ThreadWeaver等提升推理效率的方法,以及围绕Grokking现象开展的可解释性研究。

相较田渊栋的克制,LeCun对Meta提出尖锐批评,指出其过度依赖大语言模型,尤其质疑新组建的超级智能实验室成员缺乏科研经验与协作能力。

他强调LLM受限于语言建模本质,“是死胡同”,实现人类水平智能必须构建理解物理世界的世界模型——而这正是Meta已放弃的方向。

离开Meta做点啥?创业

LeCun创立新公司Advanced Machine Intelligence(AMI),专注开源世界模型研发,采用V-JEPA架构,目标是通过视频与空间数据学习,赋予AI规划、推理与长期记忆能力。

LeCun将担任执行主席而非CEO,日常管理由Nabla联合创始人Alex LeBrun负责。

他预计V-JEPA初始版本将在12个月内推出,并在未来数年持续推进,虽距AGI仍有距离,但被视为通往通用人工智能的关键路径之一。

田渊栋亦拒绝多家大厂邀约,正式宣布创业,目前暂未披露具体方向,仅表示将作为联合创始人开启新阶段。

乘着自己还年轻,去当一家新初创公司的联合创始人。

【声明】内容源于网络
0
0
量子位
各类跨境出海行业相关资讯
内容 14600
粉丝 0
量子位 各类跨境出海行业相关资讯
总阅读106.8k
粉丝0
内容14.6k