作者 | 辰辰
出品 | 网易科技
李飞飞、杨立昆、马斯克,三位人工智能领域的顶尖人物正共同推动AI进入“下半场”——世界模型(World Models)。
他们不再局限于语言生成或代码编写,而是致力于在数字空间中重建一个符合物理规律的真实世界。而产值达1900亿美元的电子游戏产业,正成为这场技术革命的首个试验场。
(图片由AI生成)
这一技术的核心目标,是让AI具备对现实世界的深层理解能力,超越当前大模型的“复读机”模式,实现真正的空间感知与因果推理。
“空间智能”:李飞飞的破局之道
长期以来,AI被困于文字与像素构成的“扁平世界”。ChatGPT虽通晓语言逻辑,却不理解重力;Sora能生成视频,却常出现物体穿透等违反物理规律的现象。
被誉为“AI教母”的李飞飞正试图打破这一局限。她创立的公司World Labs估值已超10亿美元,并于今年11月推出首款商用世界模型平台Marble。
Marble不仅能生成视频,更能根据一句话或一张照片,构建出可自由探索、符合物理规则的3D世界。用户输入“一个赛博朋克风格的小巷”,AI即可生成可供进入、交互甚至导出为游戏关卡的三维场景。
李飞飞将这种能力定义为“空间智能(Spatial Intelligence)”,并直言:“Unity和Epic的Unreal引擎都到了该被颠覆的时候。”她认为,传统游戏引擎将迎来变革,而世界模型有望彻底重塑内容创作方式。
(图片由AI生成,不代表实际效果)
杨立昆的反击:从“复读机”到因果理解
作为大语言模型(LLM)最坚定的批评者之一,杨立昆认为当前AI缺乏常识,仅依赖概率进行文本预测。他提出“世界模型”才是通往真正智能的关键路径。
近期,他创办高级机器智能实验室(AMI Labs),并计划以30亿欧元估值融资5亿欧元,显示出其商业化决心。
与LLM不同,杨立昆的世界模型强调通过视觉、声音、传感器等感官数据学习物理规律。例如,AI需理解“推倒杯子会落地”、“松手后球会下落”等因果关系,从而从根本上解决AI“幻觉”问题。
值得注意的是,AMI Labs聘请了明星医疗AI公司Nabla的联合创始人亚历克斯·勒布伦担任CEO,表明其不仅关注理论研究,更瞄准医疗、游戏等实际应用场景。
谷歌DeepMind Genie 3:实时交互的“造物主”原型
如果说李飞飞和杨立昆分别从应用与理论层面推进世界模型发展,谷歌DeepMind则推出了更具突破性的技术原型——Genie 3。
这是一款能够实时生成、实时交互的动态世界模型,每秒可渲染24帧、分辨率达720p,用户输入指令后,系统瞬间构建出可探索的数字环境。
(图片由AI生成)
Genie 3最令人瞩目的是其“物理记忆”功能:
- 持久性变化:在虚拟世界中刷红的墙面,离开后再返回仍保持原色;
- 真实物理反馈:行走阻力、滑雪惯性、游泳浮力等均符合现实规律。
更关键的是,这些物理常识并非由人工编码设定。研究团队透露,模型并未被告知“水”或“摩擦力”的定义,而是通过海量数据训练“自发涌现”出对牛顿力学的理解。
DeepMind研究总监施洛米·弗鲁克特表示,这种能力意味着AI正在自主推导物理规律。未来,Genie 3将成为具身智能的理想训练场,在机器人投入现实前,可在高保真模拟环境中完成数百万次训练。
尽管目前模型尚未完美模拟现实,但谷歌已计划开放该系统,意图主导未来3D交互标准。
马斯克的“暴力美学”:用顶级人才打造AI游戏
相较于学术派的谨慎推进,马斯克采取更为激进的策略。其xAI团队从英伟达挖走多位顶级研究员,组建“Omni团队”,专家年薪高达44万美元(约人民币320万元)。
xAI还在社交媒体X上高薪招聘“游戏导师”,时薪达100美元,专门训练AI模型Grok学习游戏机制与设计逻辑。
(图片由AI生成)
马斯克公开承诺:将在2026年底前推出一款完全由AI生成的伟大游戏。
对他而言,游戏只是测试场。世界模型的表现将直接影响Optimus人形机器人在现实中的操作能力,以及特斯拉FSD自动驾驶系统应对复杂路况的可靠性。正如英伟达所言,世界模型的潜在市场规模几乎等同于整个全球经济。
1900亿美元的诱惑与行业转型
为何巨头纷纷押注游戏?数据显示,全球游戏产业年收入近1900亿美元,但面临严峻成本危机:
- 3A大作开发周期长达5至7年;
- 制作成本常超10亿美元;
- 大量艺术家从事重复性建模工作。
Genie 3项目负责人弗鲁克特预测:“游戏创作将在未来几年发生彻底变革。”当前AI已可将开发效率提升4倍,近90%的游戏开发者已在使用AI工具。
Game Gears工作室CEO亚历山大·瓦先科指出:“很快,影视和游戏行业若不依赖AI,将难以为继。”AI使工作室能先生成玩法原型测试市场反应,再决定是否投入开发,大幅降低风险。
未来,“3D建模”和“复杂开发软件”或将被淘汰。普通用户只需语音指令,如“创建粉红色的《指环王》风格开放世界”,AI即可实时构建专属游乐场。
技术奇点背后的阴影:内容垃圾与行业冲突
技术飞跃也带来挑战。欧洲多个游戏工会近期联合抗议,反对企业强制员工使用AI工具,担忧由此引发的工作条件恶化与大规模裁员。
更大的争议在于艺术价值。批评者担心,当AI可无限生成3D环境时,玩家将面对大量“内容垃圾”——外表精美却缺乏灵魂与人文温度的作品。
Larian Studios负责人迈克尔·多斯指出:“游戏行业缺的不是工具,而是领导力和愿景。”他认为,行业不应沉迷于“数学生成的玩法循环”,而应回归人类情感表达的本质。

