大数跨境

一句话,AI 直接给我建了个能跑能跳的「吉卜力」3D小镇

一句话,AI 直接给我建了个能跑能跳的「吉卜力」3D小镇 APPSO
2026-04-17
4
导读:集中爆发本身就是一个信号

本周AI领域,世界模型成为新热点。除Anthropic发布Opus 4.7外,李飞飞创立的World Labs开源Spark 2.0,腾讯迅速发布并开源混元3D世界模型2.0(HY-World 2.0),阿里创新事业部团队接连推出HappyOyster,英伟达则通过论文低调发布Lyra 2.0。此类密集发布标志着行业从"生成单张图像/视频"迈向"构建3D交互世界"的新阶段。

资本市场积极回应:空间智能公司群核科技成功登陆港交所,被誉为"世界模型第一股",印证技术商业化前景。

从看电影到创建可玩世界

腾讯混元3D世界模型2.0的核心突破在于输出真正可交互的3D资产。例如输入"吉卜力风格的山间小镇,黄昏",模型生成环境后,用户可直接下载全景图、.spz、.ply及碰撞网格等文件格式。这些资产支持导入Unity、Unreal引擎,供开发者快速搭建游戏场景。

模型对图文提示兼容性强:上传《星际穿越》电影截图或Unsplash高清雪山图片,均能生成高真实感场景。用户需注意提示规范——优先采用"场景类别+视觉特征+风格"结构,避免人物特写及纯色背景。

实时角色漫游体验

模型新增角色操控模式,用户可在生成世界中行走、跳跃、转弯,物理碰撞引擎确保角色不穿墙、不越界。相比1.0版,2.0单次生成时长约1分钟,画面精细度与流畅性显著提升。

技术架构升级

全新架构实现"理解-生成-重建"闭环:

HY-Pano-2.0:无需专业相机参数,普通图片即可映射360°全景;

空间Agent技术:智能规划漫游轨迹,确保物理与视觉衔接自然;

HY-WorldMirror 2.0:支持大幅度视角变换,维持物体完整度。

该方案将传统需数月构建的3D世界流程,简化为单人创意驱动。输入多图或视频流即可重建真实场景,生成可直接用于开发的原型资产。

行业格局与未来展望

头部企业的差异化路径正勾勒出世界模型全貌:阿里HappyOyster聚焦自然语言干预场景演化;英伟达Lyra 2.0单图生成90米连贯3D环境,适配机器人物理训练;李飞飞Spark 2.0通过流式加载技术,使上亿粒子级世界可在普通手机端运行。

当前世界模型尚未迎来ChatGPT式爆发,各家在画质精度、交互体验等维度持续优化。随着AI深度融入3D设计工作流,从AI辅助迈向AI主导的拐点渐近——构建可玩的3D世界将如刷短视频般自然流畅。

如同科幻叙事中人类对"造物主"角色的本能向往,这项技术终将重塑我们与虚拟世界的交互方式。

【声明】内容源于网络
0
0
APPSO
AI第一新媒体,「超级个体」的灵感指南。 #AIGC #智能设备 #独特应用 #Generative Al
内容 0
粉丝 0
APPSO AI第一新媒体,「超级个体」的灵感指南。 #AIGC #智能设备 #独特应用 #Generative Al
总阅读0
粉丝0
内容0