Meta被曝用阿里通义千问训练下一代旗舰模型
外媒报道称,Meta正在训练的下一代旗舰大模型“Avocado”已直接调用阿里巴巴开源的大模型通义千问系列进行知识蒸馏优化。训练语料中包含千问3的推理输出,旨在提升代码生成与多轮对话能力。
据知情人士透露,相关方案已于11月下旬获得Meta技术副总裁签字确认,并上报CEO扎克伯格。Meta发言人回应媒体时表示“训练工作按计划推进”,但未否认使用中国开源模型一事。
TBD Lab重组AI战略
TBD Lab(To Be Determined Lab)是Meta内部成立的“超级智能特警队”。该团队的设立背景是今年4月发布的Llama 4性能未达预期,导致Meta在生成式AI市场份额降至11%,落后于OpenAI的43%,并被DeepSeek超越,开源模型领域的领先地位受到挑战。
为此,扎克伯格亲自牵头重组AI战略,致力于通过开发Llama 4.5(又称Llama 4.X)重夺技术主导权。
通义千问3成“性价比最优”选择
通义千问3由阿里达摩院于今年8月18日发布,采用Apache 2.0协议完全开源,上线24小时内下载量突破23万,目前已迭代至3.1版本。根据GitHub与Hugging Face公开数据,其参数规模覆盖0.6B至235B,在HumanEval评测中得分82.6,高于同期Meta Llama 4的75.9。
彭博社援引消息指出,Meta TBD Lab评估认为,千问3在STEM推理与中文语义理解方面表现突出,具备“最高性价比”,因此被纳入Avocado模型的知识蒸馏队列。
资本加码追赶竞争,监管关注数据来源
Meta内部备忘录显示,扎克伯格已批准将2026年资本开支上调至700亿美元,三年累计投入预计达6000亿美元,全力支持AI研发。Avocado被列为“必须赢”的重点项目,计划于2026年第一季度以闭源形式发布,届时将停止对外完全开源权重。
在事件曝光前,欧盟委员会已于11月28日向Meta发出监管问询函,要求说明Avocado训练数据来源,特别是涉及中国开源模型的跨境数据流动情况。目前Meta法务团队正评估是否需在模型卡中标注“包含Qwen系列蒸馏成分”。若最终实施,这将是美国科技巨头首次在官方文档中承认使用中国开源模型作为技术底座。
中国开源模型全球影响力持续上升
中国信通院发布的《全球人工智能开源生态白皮书》显示,截至2025年11月,中国开源大模型贡献量占全球32%,通义千问、DeepSeek、ChatGLM三大系列均已进入GitHub星标项目前二十名。报告指出,中国开源模型正实现“反向输出”,成为美国头部企业闭源系统的重要参考。
截至发稿,阿里巴巴尚未就“Meta蒸馏千问”作出回应。但通义千问GitHub仓库在过去12小时内新增星标4200个,其中63%来自北美和欧洲开发者账号,“Avocado ingredient”已成为社区讨论热词。


网友对Meta高薪挖角研究员后套壳开源的行为展开调侃。




