Meta Llama 4 发布：开源大模型的新里程碑？- 大数跨境

钛能AI实验室

2025-04-08

导读：当下，大模型领域的竞争呈现出白热化态势。年初，DeepSeek 强势入局，搅乱了原本的市场格局。

当下，大模型领域的竞争呈现出白热化态势。

年初，DeepSeek 强势入局，搅乱了原本的市场格局。与此同时，OpenAI、Anthropic、xAI 以及谷歌等科技巨头，凭借闭源模型持续发力，不断巩固自身在行业内的地位。在这股浪潮中，Meta 早期推出的 Llama 模型，在大模型排行榜上一度销声匿迹。

不过，Meta 近日重磅发布的 Llama 4 系列模型，宛如一颗投入平静湖面的巨石，瞬间激起千层浪，成为整个行业关注的焦点。此举无疑彰显了 Meta 重夺 “最强开源模型” 宝座的坚定决心。

但是，真的进入新阶段了吗？

Llama 4 家族由三款极具特色的模型组成：

Llama 4 Scout：
1090 亿参数（170 亿活跃参数、16 专家），支持 1000 万上下文长度，是目前上下文最长的模型，适合多文档检索总结、超长代码库调试推理、个性化处理高密度用户行为数据，已开放下载。
Llama 4 Maverick：
4000 亿参数（170 亿活跃参数、128 专家），定位旗舰通用模型，注重单次推理质量和图文理解，在 LMSYS 排行榜仅次于谷歌 Gemini 2.5 Pro，已开放下载。
Llama 4 Behemoth：
近 2 万亿参数（2880 亿活跃参数、16 专家），还在训练中，是 “教师模型”，性能超越 GPT-4.5 等，暂未开放下载。

这三款模型均采用了先进的混合专家（MoE）架构。该架构的精妙之处在于，在处理每个 token 时，仅激活部分参数，这一设计大幅提升了训练和推理效率，同时显著降低了计算成本。

以 Llama 4 Maverick 为例，其 4000 亿参数中，活跃参数仅为 170 亿，却能在单个 NVIDIA H100 GPU 上流畅运行，这一特性极大地降低了模型的部署门槛，为开发者和研究人员带来了前所未有的便利。

在上下文长度方面，Llama 4 展现出了卓越的性能。Llama 4 Scout 的上下文长度达到惊人的 1000 万 tokens，堪称目前上下文最长的模型。

这一优势使其在多文档检索总结、超长代码库调试推理，以及个性化处理高密度用户行为数据等复杂场景中，具备无可比拟的优势。而支持原生多模态的 Llama 4 Maverick，上下文长度也达到了 100 万 tokens，能够轻松应对复杂的多模态任务，为用户提供更加高效、精准的服务。

多模态能力是 Llama 4 的又一突出亮点。它能够同时理解和处理文本与图像信息，并在统一框架下进行联合学习和推理。通过早期融合技术，Llama 4 利用海量无标签文本、图片和视频数据进行预训练，将文本和视觉 token 无缝整合，为模型应用开拓了更为广阔的空间。这一特性使得 Llama 4 在智能客服、智能办公等领域具有巨大的应用潜力。

在模型性能上，Llama 4 Behemoth 无疑是最耀眼的存在。尽管目前仍处于紧张的训练阶段，且尚未公开，但在多个权威基准测试中，它已经成功超越 GPT - 4.5 和 Claude Sonnet 3.7 等行业标杆。

作为教师模型，Llama 4 Behemoth 为整个 Llama 4 系列的性能提升做出了重要贡献。Llama 4 Maverick 在定位旗舰通用模型的道路上表现出色，注重单次推理质量和图文理解，在 LMSYS 排行榜上仅次于谷歌 Gemini 2.5 Pro，充分证明了其在通用模型领域的强大实力。