Meta被曝用阿里通义千问蒸馏训练下一代旗舰模型Avocado
外媒报道称,Meta正在训练的下一代旗舰大模型“Avocado”已直接调用阿里巴巴开源的通义千问系列进行知识蒸馏优化。训练语料中包含千问3的推理输出,旨在提升代码生成与多轮对话能力。知情人士透露,该方案已于11月下旬获得技术副总裁签字,并上报CEO扎克伯格审批。
针对媒体问询,Meta发言人回应称“训练工作按计划推进”,但未否认使用中国开源模型的事实。
TBD Lab重组AI战略,Avocado成关键项目
TBD Lab(To Be Determined Lab)是Meta内部成立的“超级智能特警队”。其背景源于今年4月发布的Llama 4性能未达预期,导致Meta在生成式AI市场份额跌至11%,远低于OpenAI的43%,并被DeepSeek超越,开源领域领导地位面临挑战。
为此,扎克伯格亲自牵头重组AI战略,推动开发Llama 4.5(又称Llama 4.X),力图重夺技术优势。
通义千问3因高性价比入选蒸馏队列
据彭博社援引知情人士消息,Meta TBD Lab评估认为,通义千问3在STEM推理和中文语义理解两项基准测试中表现突出且“性价比最优”,因此被纳入Avocado的知识蒸馏流程。
通义千问3由阿里达摩院于今年8月18日发布,采用Apache 2.0协议完全开源,上线24小时内下载量突破23万,目前已迭代至3.1版本。根据GitHub与Hugging Face公开数据,其参数规模覆盖0.6B至235B,HumanEval评测得分为82.6,高于同期Meta Llama 4的75.9。
资本开支大幅上调,Avocado将闭源发布
Meta内部备忘录显示,扎克伯格已批准将2026年资本开支上调至700亿美元,三年累计投入预计达6000亿美元,用于加速追赶AI竞争对手。Avocado被列为“必须赢”的核心项目,计划于2026年第一季度以闭源形式发布,届时将停止对外完全开源模型权重。
欧盟启动监管问询,或首次标注中国模型成分
在事件曝光前,欧盟委员会已于11月28日向Meta发出常规监管问询函,要求说明Avocado训练数据来源,特别是涉及中国开源模型的跨境数据流动细节。目前Meta法务团队正评估是否需在模型卡中标注“包含Qwen系列蒸馏成分”。若最终实施,这将是美国科技巨头首次在官方文档中承认使用中国开源模型作为技术底座。
中国开源模型全球影响力持续上升
中国信通院发布的《全球人工智能开源生态白皮书》指出,截至2025年11月,中国开源大模型贡献量占全球32%,通义千问、DeepSeek、ChatGLM三大系列均已进入GitHub星标前二十。报告强调,中国开源模型已实现“反向输出”,成为美国头部企业闭源系统的重要参考。
截至目前,阿里巴巴方面尚未对“Meta蒸馏千问”一事作出回应。但通义千问GitHub仓库在过去12小时内新增星标4200个,其中63%来自北美与欧洲用户。开发者社区中,“Avocado ingredient”已成为热门讨论话题。


