大数跨境

昆仑万维开源 Matrix-Game 2.0:25FPS 实时交互世界模型,技术商业双轮驱动开启 AI 产业化闭环

昆仑万维开源 Matrix-Game 2.0:25FPS 实时交互世界模型,技术商业双轮驱动开启 AI 产业化闭环 元龙数字智能科技
2025-08-13
1
导读:—昆仑万维开源Matrix-Game 2.0—25FPS 实时交互世界模型技术商业双轮驱动开启 AI 产业化闭

昆仑万维开源Matrix-Game 2.0

25FPS 实时

交互世界模型

技术商业双轮驱动

开启 AI 产业化闭环


近一周来,世界模型领域热度飙升。DeepMind 新发布的 Genie 3 凭借交互式、实时化、长序列生成的特性,让 “虚拟世界可随时交互操控” 这一抽象概念转化为具象的产品形态。但 Genie 3 未公开源代码,导致众多开发者只能对其技术细节进行推测。在此背景下,昆仑万维实现了 DeepMind 未完成的突破。8 月 12 日,即昆仑万维 Skywork AI 技术发布周的次日,该公司推出自主研发的 Matrix 系列升级版 —— 交互式世界模型 Matrix-Game 2.0。

相较于 Genie 3,Matrix-Game 2.0 不仅达成了通用场景下实时长序列交互生成的能力,更突破性地实现完整开源,成为业内首个在通用场景中落地该能力的开源世界模型。这一举措意义重大,意味着技术社区不仅能直观看到最终效果,还可对其进行复现、优化,甚至直接嵌入实际项目中。与侧重技术展示的 Genie 3 不同,Matrix-Game 2.0 更注重产业化应用,旨在让该技术实现即调即用,直接服务于游戏引擎、具身智能、虚拟人交互等场景。昆仑万维正将世界模型从实验室推向实际生产领域,过去两年大量的研发投入终于进入成果转化阶段,技术产出持续转化为营收增长的动力。随着技术与商业的协同发展,昆仑万维率先开启了 AI 领域商业化的全新阶段。

Matrix-Game 2.0 将 “交互式世界模型” 从理论技术转变为可直接操作的实用工具。用户仅需借助键盘和鼠标,就能在模型生成的虚拟世界中实时移动、转向和执行动作,画面以 25FPS 的速率连续输出,且在分钟级的长序列中保持物理逻辑与细节的稳定性。

在 GTA 场景里,白天的城市主干道上,车辆行人往来不绝。玩家驾驶轿车在车流中穿梭时,转向、加速及刹车等操作都能实时呈现在画面里。每秒 25 帧的实时渲染效果,使光影变化、路面反光以及非玩家角色的动作都维持着高度的稳定性与一致性。高速公路疾驰的画面中,远处的山体与天空细节清晰可辨,玩家变道、提速等操作与场景变化衔接自然,毫无违和感。模型在分钟级长序列中保持连贯,光照切换与物理碰撞均无延迟,为玩家带来流畅体验。

MC 的像素风格方块世界中,远处是起伏的山丘与树木。玩家操控角色行走、跳跃时,每一个动作指令都能即时转化为生成画面。即便在低纹理细节环境下,模型仍能精准保持物体位置与交互逻辑。在复杂地形攀爬时,方块台阶与悬崖边缘衔接流畅。25FPS 的生成速度保障了视角切换的顺滑度,角色的运动轨迹与地形碰撞均符合物理规律,让玩家在像素世界中也能获得真实的交互感受。

经典游戏神庙逃亡的场景中,高速奔跑的赛道两侧是古老石墙与悬崖。玩家连续完成转弯、跳跃、下蹲等动作时,模型能即时生成对应的视角变化。动作与背景透视精准同步,无拖影或卡顿现象,让玩家沉浸于紧张刺激的奔跑过程。

在 Wild 场景中,玩家沿小路缓慢行进并调整视角,光影变化与植被细节会随操作同步改变。在长达数分钟的生成过程中,环境细节在长时间序列里未出现明显偏差,始终保持场景稳定。

除了演示案例,Matrix-Game 2.0 的技术报告同样值得关注。其设计宗旨是构建一个既可操控又能实时响应的虚拟世界,并在长时间运行中保持流畅性与物理一致性。技术方案分为四个层面:核心理念、模型架构、生成机制以及数据与任务设计。

与众多依赖文本提示的生成模型不同,Matrix-Game 2.0 完全摒弃语言输入,以视觉作为唯一信号。这种方式规避了语言先验可能引发的语义偏差,使模型直接从画面中学习空间结构、物体关系和物理规律,进而生成更贴近真实的虚拟场景。

在架构设计上,模型以图像为核心,由三大组件构成。3D Causal VAE 压缩结构从空间和时间双维度对视频实现高效压缩,在保留关键信息的同时降低计算成本。多模态扩散 Transformer(DiT)融合视觉编码与用户操作指令,逐帧生成符合物理规律的动态视频序列,再通过 3D VAE 解码为完整画面。动作控制模块借鉴 GameFactory 与 Genie 系列的交互框架,引入帧级别的键盘和鼠标输入,实现即时操控与世界生成的无缝衔接。

当然,Matrix-Game 2.0 也面临长序列视频常见的延迟与误差累积问题,但其通过三项专有机制有效解决了这些问题。因果扩散训练将双向扩散提炼为因果模型,仅依据历史帧生成当前帧,减少等待时间并提升推理速度。分布匹配蒸馏(DMD)在训练过程中最小化学生模型与原始模型的生成分布差异,保障长时间生成时的画面稳定性,减少偏差。KV-Cache 缓存机制保存注意力上下文,实现滚动生成,避免重复计算,即便在单 GPU 环境下也能达到 25 FPS 的实时速率。

此外,为确保模型在多场景下的表现,研发团队基于 Unreal Engine 和 GTA5 搭建了可扩展的数据生产管线,生成了数千小时的高质量交互视频,覆盖多种风格与任务场景。并在此基础上训练出多个子模型:Matrix-Game Uni 适用于多种真实感静态场景的探索;Matrix-Game TempleRun 针对跑酷类游戏,具备精准的动作响应能力;Matrix-Game GTA 可模拟动态城市与车辆运行,场景中的物体拥有独立运动轨迹。

总体而言,结合架构与数据优势,Matrix-Game 2.0 在三方面表现突出。一是高帧率长序列生成,支持分钟级连续交互视频生成,动作流畅且响应及时;二是多场景适配能力,无需重新训练即可适应多种风格与环境,从写实城市到艺术化场景均能生成;三是物理一致性增强,角色在复杂地形中的行为符合物理逻辑,大幅提升沉浸感与可控性。凭借这些特性,Matrix-Game 2.0 不仅可应用于游戏内容创作,还能为具身智能训练、虚拟现实、影视制作及元宇宙内容生产提供稳定的技术支持。

以往,AI 企业多依赖出售单一模型能力,通过 API 调用费用或订阅模式获取收益。这种模式虽具有轻资产、易启动的优势,但存在明显短板:客户忠诚度较低,容易被其他产品取代,商业发展空间有限。而昆仑万维此次 “技术周” 释放的信号清晰表明:其正从 “售卖模型” 转向 “提供系统”,即利用多模态能力构建整套可直接融入客户工作流程的行业解决方案。如此一来,客户不再仅是购买某一模型的使用权,而是将部分工作链条外包给昆仑万维的 AI 系统,从而形成更强的合作绑定与更稳定的收入来源。这种模式转变是从单点能力变现升级为体系化能力变现的过程,也是主动抢占未来竞争制高点的战略举措。

这种体系化转型不仅改变了昆仑万维的业务重心,还契合了行业发展趋势:多模态闭环已成为全球 AI 厂商的必争领域,率先实现规模化落地的企业有望在新一轮产业调整中占据优势地位。昆仑万维 2025 年第一季度财报显示,经营性现金流净额增长 58.3%,显然 2024 年 15.4 亿元的研发投入正持续转化为营收增长动力。这验证了 AI 技术商业化的可持续性,使昆仑万维成为国内首个实现 “研发投入 — 产品变现 — 现金流反哺” 闭环的 AI 企业。

Matrix-Game 2.0 只是其中一个标志,本次技术发布周中,昆仑万维还推出了视频生成模型(Skyreels)等产品,这些产品将在短视频、直播带货、具身智能、游戏等领域发挥重要作用,率先实现商业化应用。可以预见,昆仑万维将持续实现营收增长,技术产品矩阵不断落地,真正迎来技术与商业的双重加速,这一进程已在推进中。

随着 Matrix-Game 2.0 的开源,整个 AI 社区将能共同参与该技术的完善与发展,推动交互式世界模型在更多领域的应用与创新。这不仅对昆仑万维自身发展意义重大,也将为整个 AI 行业的进步注入新动力,开启全新的交互式虚拟世界时代。在这个时代,虚拟与现实的界限将更加模糊,人们的生活、工作与娱乐方式都可能发生深刻变革。

对游戏行业而言,Matrix-Game 2.0 的出现将大幅降低游戏开发的门槛与成本。开发者可利用开源模型快速搭建游戏场景,实现丰富的交互功能,缩短研发周期。同时,多场景适配能力使一款游戏能轻松适应不同风格与环境,满足多样化玩家需求,提升市场竞争力。

在具身智能领域,Matrix-Game 2.0 提供的稳定虚拟环境可作为智能体训练的理想场所。智能体在虚拟世界中进行大量训练,学习各类物理规律与交互方式后再应用于现实世界,将显著提高具身智能的应用效果与安全性。

虚拟现实和元宇宙领域也将因 Matrix-Game 2.0 受益。更真实、流畅、可控的虚拟场景将增强用户沉浸感,使虚拟现实体验更接近现实。元宇宙的内容生产也将更高效丰富,用户可在其中自由创造与交互,构建专属虚拟世界。

影视制作方面,Matrix-Game 2.0 的实时生成与交互能力能为影视特效制作提供新思路。导演可在虚拟场景中实时调整镜头与场景,提高制作效率,打造更震撼的视觉效果。

综上,昆仑万维 Matrix-Game 2.0 的推出是 AI 世界模型发展的重要里程碑。其开源特性将促进技术快速迭代创新,商业化潜力将推动 AI 技术在各领域广泛应用。我们有理由相信,在 Matrix-Game 2.0 等先进技术的推动下,AI 行业将迎来更广阔的发展前景,为人类社会带来更多惊喜与变革。


END

【声明】内容源于网络
0
0
元龙数字智能科技
永做第一 使命第一 向善第一
内容 901
粉丝 0
元龙数字智能科技 永做第一 使命第一 向善第一
总阅读2.2k
粉丝0
内容901