Meta重推大模型:Muse Spark正式上线
Meta重金组建的超级智能实验室(MSL)正式交出首份成绩单。29岁的前Scale AI联合创始人Alexandr Wang带领团队完成这一重要突破。
作为生成式AI领域的关键玩家,Meta凭借开源Llama系列模型积累了庞大用户群。然而Llama 4发布后出现负面评价及刷榜质疑,促使扎克伯格在2025年夏季启动AI业务重组,成立MSL实验室并任命Wang为首任首席AI官。
经过九个月的全面重构,团队对技术栈进行彻底升级,包括基础设施、模型架构和数据管线。如今Muse Spark作为这一系列调整的成果正式推出,已成为Meta AI的核心驱动力。
Wang在社交平台X上表示,Muse Spark是Meta迄今发布的最强模型,具备工具调用、视觉思维链及多智能体协同能力,将作为全新Muse模型家族的起点。多位从OpenAI跳槽至Meta的核心研究人员已开始投入新模型的应用。
核心性能亮点
Muse Spark在多模态感知、推理、医疗任务及各类agent任务上表现卓越。Meta同时推出Contemplating(深度思考)模式,可调度多个agent并行推理,在推理能力上达到行业领先水平。
在关键评测中,启用Contemplating模式的Muse Spark在Humanity's Last Exam测试中达到58%,在FrontierScience Research测试中达到38%。该深度思考模式将逐步在meta.ai中上线。
扩展维度解析
预训练体系革新
团队对预训练体系进行全方位重构,涵盖模型架构、优化方法及数据构建。新体系显著提升算力效率,相比Llama 4 Maverick,现可用超过一个数量级更少的算力达到相同能力水平。
强化学习优化
新体系下强化学习表现稳定可预测。训练数据显示,随着计算量增加,pass@1和pass@16指标呈现对数线性增长,证明模型在提升可靠性的同时保持推理多样性。测试集准确率持续提升,验证了良好的泛化能力。
测试时推理创新
通过思考时间惩罚优化token使用效率,模型能用更少tokens完成复杂问题求解。同时采用多智能体协同技术,在保持响应速度的前提下提升性能表现。实验表明,相比传统扩展方式,多agent并行推理在相近延迟下实现更优性能。
多元化应用场景
Muse Spark被视为迈向个人超级智能的第一步,能理解用户环境并提供智能延伸服务。在健康领域,团队与逾千名医生合作构建训练数据,提升模型健康推理能力。在家庭应用方面,其多模态能力可分析周围场景,生成交互式内容或提供设备维护指导。
当前Muse Spark仅限Meta AI应用和网站使用,并通过私有API预览向部分用户开放。Meta尚未公布定价策略,也未明确Llama系列后续开发计划。作为专注于构建个人超级智能基础的模型,其定位并非通用聊天机器人,而是提供深度个性化服务的数字延伸。目前该模型暂未完全取代Meta现有产品线。

