大数跨境

Meta Llama 4 发布:开源大模型的新里程碑?

Meta Llama 4 发布:开源大模型的新里程碑? 钛能AI实验室
2025-04-08
1
导读:当下,大模型领域的竞争呈现出白热化态势。年初,DeepSeek 强势入局,搅乱了原本的市场格局。
当下,大模型领域的竞争呈现出白热化态势。
年初,DeepSeek 强势入局,搅乱了原本的市场格局。与此同时,OpenAI、Anthropic、xAI 以及谷歌等科技巨头,凭借闭源模型持续发力,不断巩固自身在行业内的地位。在这股浪潮中,Meta 早期推出的 Llama 模型,在大模型排行榜上一度销声匿迹。
不过,Meta 近日重磅发布的 Llama 4 系列模型,宛如一颗投入平静湖面的巨石,瞬间激起千层浪,成为整个行业关注的焦点。此举无疑彰显了 Meta 重夺 “最强开源模型” 宝座的坚定决心。
但是,真的进入新阶段了吗?

Llama 4 家族由三款极具特色的模型组成:
  • Llama 4 Scout:
    1090 亿参数(170 亿活跃参数、16 专家),支持 1000 万上下文长度,是目前上下文最长的模型,适合多文档检索总结、超长代码库调试推理、个性化处理高密度用户行为数据,已开放下载。

  • Llama 4 Maverick:
    4000 亿参数(170 亿活跃参数、128 专家),定位旗舰通用模型,注重单次推理质量和图文理解,在 LMSYS 排行榜仅次于谷歌 Gemini 2.5 Pro,已开放下载。

  • Llama 4 Behemoth:
    近 2 万亿参数(2880 亿活跃参数、16 专家),还在训练中,是 “教师模型”,性能超越 GPT-4.5 等,暂未开放下载。

这三款模型均采用了先进的混合专家(MoE)架构。该架构的精妙之处在于,在处理每个 token 时,仅激活部分参数,这一设计大幅提升了训练和推理效率,同时显著降低了计算成本。
以 Llama 4 Maverick 为例,其 4000 亿参数中,活跃参数仅为 170 亿,却能在单个 NVIDIA H100 GPU 上流畅运行,这一特性极大地降低了模型的部署门槛,为开发者和研究人员带来了前所未有的便利。

在上下文长度方面,Llama 4 展现出了卓越的性能。Llama 4 Scout 的上下文长度达到惊人的 1000 万 tokens,堪称目前上下文最长的模型。

这一优势使其在多文档检索总结、超长代码库调试推理,以及个性化处理高密度用户行为数据等复杂场景中,具备无可比拟的优势。而支持原生多模态的 Llama 4 Maverick,上下文长度也达到了 100 万 tokens,能够轻松应对复杂的多模态任务,为用户提供更加高效、精准的服务

多模态能力是 Llama 4 的又一突出亮点。它能够同时理解和处理文本与图像信息,并在统一框架下进行联合学习和推理。通过早期融合技术,Llama 4 利用海量无标签文本、图片和视频数据进行预训练,将文本和视觉 token 无缝整合,为模型应用开拓了更为广阔的空间。这一特性使得 Llama 4 在智能客服、智能办公等领域具有巨大的应用潜力。

在模型性能上,Llama 4 Behemoth 无疑是最耀眼的存在。尽管目前仍处于紧张的训练阶段,且尚未公开,但在多个权威基准测试中,它已经成功超越 GPT - 4.5 和 Claude Sonnet 3.7 等行业标杆。

作为教师模型,Llama 4 Behemoth 为整个 Llama 4 系列的性能提升做出了重要贡献。Llama 4 Maverick 在定位旗舰通用模型的道路上表现出色,注重单次推理质量和图文理解,在 LMSYS 排行榜上仅次于谷歌 Gemini 2.5 Pro,充分证明了其在通用模型领域的强大实力。




从可用性来看,Llama 4 Maverick 和 Scout 模型已llama.com和 Hugging Face 平台开放下载,开发者和研究人员可以便捷地获取并使用。

虽然 Meta 官方并未提供 API 服务,但个人用户可通过官网、WhatsApp 等官方渠道使用该模型,只是目前尚不确定集成的具体是哪一款模型。

值得一提的是,OpenRouter 等第三方 API 服务已上线 Llama 4 Scout 和 Llama 4 Maverick 的免费 API,进一步拓宽了用户的使用途径。


然而,Llama 4 并非十全十美。其核心路径仍沿用传统方式,在推理模型、内置思维链等方面缺乏创新。

尽管如此,Llama 4 在性能、参数规模以及开源等方面展现出的诚意,为大模型的发展注入了新的活力。

它标志着 Meta 在大模型赛道上的全新起点,我们有理由期待 Meta 在未来持续发力,不断推动大模型技术创新,为开源社区乃至整个 AI 领域带来更多的惊喜。




图片
虽然AI不是万能的,但不用AI是真的会“掉队”!

图片来源于网络

#AI 逆袭 #中国科技 #科技热点

👉 关注 @钛能 AI 实验室,获取最硬核的 AI 前沿资讯!

📩 点击 “在看” 并留言,聊聊你最期待的 AI 应用场景~

【声明】内容源于网络
0
0
钛能AI实验室
一个关于AI的自媒体账号
内容 0
粉丝 0
钛能AI实验室 一个关于AI的自媒体账号
总阅读0
粉丝0
内容0