- Llama 4 Scout:
1090 亿参数(170 亿活跃参数、16 专家),支持 1000 万上下文长度,是目前上下文最长的模型,适合多文档检索总结、超长代码库调试推理、个性化处理高密度用户行为数据,已开放下载。
- Llama 4 Maverick:
4000 亿参数(170 亿活跃参数、128 专家),定位旗舰通用模型,注重单次推理质量和图文理解,在 LMSYS 排行榜仅次于谷歌 Gemini 2.5 Pro,已开放下载。
- Llama 4 Behemoth:
近 2 万亿参数(2880 亿活跃参数、16 专家),还在训练中,是 “教师模型”,性能超越 GPT-4.5 等,暂未开放下载。
在上下文长度方面,Llama 4 展现出了卓越的性能。Llama 4 Scout 的上下文长度达到惊人的 1000 万 tokens,堪称目前上下文最长的模型。
这一优势使其在多文档检索总结、超长代码库调试推理,以及个性化处理高密度用户行为数据等复杂场景中,具备无可比拟的优势。而支持原生多模态的 Llama 4 Maverick,上下文长度也达到了 100 万 tokens,能够轻松应对复杂的多模态任务,为用户提供更加高效、精准的服务。
多模态能力是 Llama 4 的又一突出亮点。它能够同时理解和处理文本与图像信息,并在统一框架下进行联合学习和推理。通过早期融合技术,Llama 4 利用海量无标签文本、图片和视频数据进行预训练,将文本和视觉 token 无缝整合,为模型应用开拓了更为广阔的空间。这一特性使得 Llama 4 在智能客服、智能办公等领域具有巨大的应用潜力。
在模型性能上,Llama 4 Behemoth 无疑是最耀眼的存在。尽管目前仍处于紧张的训练阶段,且尚未公开,但在多个权威基准测试中,它已经成功超越 GPT - 4.5 和 Claude Sonnet 3.7 等行业标杆。
作为教师模型,Llama 4 Behemoth 为整个 Llama 4 系列的性能提升做出了重要贡献。Llama 4 Maverick 在定位旗舰通用模型的道路上表现出色,注重单次推理质量和图文理解,在 LMSYS 排行榜上仅次于谷歌 Gemini 2.5 Pro,充分证明了其在通用模型领域的强大实力。
虽然 Meta 官方并未提供 API 服务,但个人用户可通过官网、WhatsApp 等官方渠道使用该模型,只是目前尚不确定集成的具体是哪一款模型。
值得一提的是,OpenRouter 等第三方 API 服务已上线 Llama 4 Scout 和 Llama 4 Maverick 的免费 API,进一步拓宽了用户的使用途径。
然而,Llama 4 并非十全十美。其核心路径仍沿用传统方式,在推理模型、内置思维链等方面缺乏创新。
尽管如此,Llama 4 在性能、参数规模以及开源等方面展现出的诚意,为大模型的发展注入了新的活力。
它标志着 Meta 在大模型赛道上的全新起点,我们有理由期待 Meta 在未来持续发力,不断推动大模型技术创新,为开源社区乃至整个 AI 领域带来更多的惊喜。
图片来源于网络
#AI 逆袭 #中国科技 #科技热点
👉 关注 @钛能 AI 实验室,获取最硬核的 AI 前沿资讯!

