Llama 4发布:Meta新一代AI模型集合

Meta于近日正式发布了其Llama系列的最新一代AI模型集合——Llama 4,此次共推出了四款新模型:Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth。这些模型通过“海量未标注的文本、图像及视频数据”训练而成,具备广泛的视觉理解能力。
有消息指出,中国AI实验室深度求索(DeepSeek)开源模型的成功直接推动了Llama研发进程的加速,据传Meta紧急组建团队以破译其降低成本的技术路径。
开放获取与授权条款
目前Scout和Maverick已在Llama.com及Hugging Face等合作伙伴平台开放获取,而Behemoth仍处于训练阶段。Meta宣布旗下跨WhatsApp、Messenger和Instagram等应用的AI助手已启用Llama 4技术,不过多模态功能仅限美国英语用户。
Llama 4的授权条款可能引发争议。根据许可协议,欧盟境内注册或主要营业地的用户及企业被禁止使用或分发这些模型。此外,月活用户超7亿的企业须向Meta申请特殊授权。
技术创新与性能表现
Llama 4是Meta首个采用混合专家(MoE)架构的模型系列,该设计能显著提升训练及查询应答的算力效率。例如,Maverick总参数量达4000亿,但通过128个“专家”模型仅激活170亿参数;Scout包含16个专家模型,总参数量1090亿,激活170亿参数。
Meta内部测试显示,Maverick在多项基准测试中超越了OpenAI的GPT-4o和谷歌Gemini 2.0,但在STEM能力评估中逊色于部分顶级模型。Scout则以其1000万token的超大上下文窗口为优势,可处理数百万单词的庞杂文档。
尚未发布的Behemoth激活参数达2880亿,总参数近2万亿,硬件需求极高,需NVIDIA H100 DGX系统支持。
争议性问题处理优化
值得注意的是,Llama 4全系未采用类似OpenAI o1的专用“推理”架构。同时,Meta宣称对Llama 4进行了调优,使其更少拒绝回答“争议性”问题,并表示新模型在拒绝回答的提示词选择上“显著更平衡”。
Meta发言人称:“[Llama 4]能提供客观有益的回答而不带预设立场。”
[1] Meta releases Llama 4, a new crop of flagship AI models, TechCrunch报道链接

