
这款生成式世界模型在两个月前曾以封闭测试形式推出。
该大模型的推出距离 World Labs 以 2.3 亿美元融资仅过去一年多,使公司在世界模型领域暂时处于领先位置。世界模型是一类能够生成环境内部信息的 AI 系统,可用于预测未来结果、规划动作和模拟世界。
与 Decart、Odyssey 及 Google 的 Genie 等竞争者不同,Marble 并非是“边走边生成”世界的方式,而是创建持久存在、可下载的 3D 环境。
这使其在一致性和渲染稳定性上表现更佳,并允许用户将虚拟世界导出为高斯点云(Gaussian splats)、网格(Meshes)或视频格式。
Marble 还是首个提供 AI 原生编辑工具 的模型,拥有混合式 3D 编辑器,允许用户先搭建空间结构,再让 AI 填充视觉细节。
World Labs 联合创始人Justin Johnson表示:
“这是一种全新的模型类别,能够生成 3D 世界,而且它还会持续改进。过去几个月,我们已经显著提升了效果。”
早在 2024 年 12 月,World Labs 就展示了如何利用早期模型通过一张图片生成可交互 3D 场景。
不过当时的场景较卡通化,探索范围有限,还会出现渲染错误。
当在测试 Marble 测试版时发现,它能够根据图片提示生成令人惊艳的世界,比如从游戏风格的场景到逼真的客厅复刻。
新版本在边缘变形问题上有明显改进,不过记者指出,部分场景相比测试版略逊色于之前的渲染质量。
面向游戏、影视与 VR 的创意工具
Marble 目前提供四种订阅方案:
Free(免费):可生成 4 个世界(文字、图片或全景输入)
Standard(月费 $20):12 次生成,支持多图/视频输入与进阶编辑
Pro(月费 $35):25 次生成,包含场景扩展与商用授权
Max(月费 $95):75 次生成,解锁全部功能
Johnson 表示,Marble 的首批应用场景主要面向游戏开发、影视特效与虚拟现实。
对于游戏开发者而言,Marble 可用于生成背景环境与氛围场景,随后再导入 Unity 或Unreal Engine等游戏引擎中添加互动逻辑。
“我们并非要取代完整游戏制作流程,而是为开发者提供可以直接嵌入的素材资产。” Johnson 说。
在影视特效领域,Marble 的 3D 资产避免了 AI 视频生成器中常见的镜头控制不稳定问题,能让艺术家精确控制摄影机运动。
尽管 World Labs 目前不专注于 VR 应用,Johnson 指出该行业“内容极度匮乏”,因此对 Marble 的发布反响热烈。
Marble 已兼容 Apple Vision Pro 与 Meta Quest 3 头显,所有生成的世界都可直接在 VR 中观看。
创意升级:正真属于创意工作者的工具
新版本中,用户不再局限于单张图片输入。现在可以上传多张图片或短视频,从不同角度展示空间,让模型生成更逼真的数字孪生。
此外,World Labs 推出了实验性 3D 编辑器 Chisel,让用户先用“墙体”、“方块”、“平面”等基础结构搭建空间,再通过文字提示控制视觉风格。
这种方式类似网页开发中的 “HTML + CSS” 结构与样式分离。
用户还可直接在 3D 场景中操作对象,例如:
“我可以直接抓取代表沙发的 3D 方块,把它移动到别处。” Johnson 解释道。
另一项新增功能是世界扩展功能。
“当你探索到世界边缘时,可以让模型在那里继续生成、拓展更多区域。” Johnson 说。
对于需要创建庞大场景的用户,Marble 还支持“Composer 模式”,可以把多个世界拼接组合成一个更大的空间。
向空间智能迈进
李飞飞在最近发表的演讲《从文字到世界:空间智能》中说道:
“Marble 代表着迈向真正具备空间智能的世界模型的第一步。”
她认为,正如大语言模型让机器学会“读与写”,世界模型将让机器实现“看见与建造”。
理解三维空间中事物的存在与互动关系,将帮助机器在游戏、机器人、基础科学乃至医学等领域取得突破。
“没有空间智能,我们对真正智能机器的梦想将不完整。” 李飞飞表示。
欢迎点击查看原文,一键直达您的科技区角

