

曝Meta“偷师”千问，美国闭源巨头蒸馏中国开源

OFweek维科网

2025-12-12

Meta被曝用阿里通义千问训练下一代旗舰模型

外媒报道称，Meta正在训练的下一代旗舰大模型“Avocado”已直接调用阿里巴巴开源的大模型通义千问系列进行知识蒸馏优化。训练语料中包含千问3的推理输出，旨在提升代码生成与多轮对话能力。

据知情人士透露，相关方案已于11月下旬获得Meta技术副总裁签字确认，并上报CEO扎克伯格。Meta发言人回应媒体时表示“训练工作按计划推进”，但未否认使用中国开源模型一事。

TBD Lab重组AI战略

TBD Lab（To Be Determined Lab）是Meta内部成立的“超级智能特警队”。该团队的设立背景是今年4月发布的Llama 4性能未达预期，导致Meta在生成式AI市场份额降至11%，落后于OpenAI的43%，并被DeepSeek超越，开源模型领域的领先地位受到挑战。

为此，扎克伯格亲自牵头重组AI战略，致力于通过开发Llama 4.5（又称Llama 4.X）重夺技术主导权。

通义千问3成“性价比最优”选择

通义千问3由阿里达摩院于今年8月18日发布，采用Apache 2.0协议完全开源，上线24小时内下载量突破23万，目前已迭代至3.1版本。根据GitHub与Hugging Face公开数据，其参数规模覆盖0.6B至235B，在HumanEval评测中得分82.6，高于同期Meta Llama 4的75.9。

彭博社援引消息指出，Meta TBD Lab评估认为，千问3在STEM推理与中文语义理解方面表现突出，具备“最高性价比”，因此被纳入Avocado模型的知识蒸馏队列。

资本加码追赶竞争，监管关注数据来源

Meta内部备忘录显示，扎克伯格已批准将2026年资本开支上调至700亿美元，三年累计投入预计达6000亿美元，全力支持AI研发。Avocado被列为“必须赢”的重点项目，计划于2026年第一季度以闭源形式发布，届时将停止对外完全开源权重。

在事件曝光前，欧盟委员会已于11月28日向Meta发出监管问询函，要求说明Avocado训练数据来源，特别是涉及中国开源模型的跨境数据流动情况。目前Meta法务团队正评估是否需在模型卡中标注“包含Qwen系列蒸馏成分”。若最终实施，这将是美国科技巨头首次在官方文档中承认使用中国开源模型作为技术底座。