专注AIGC技术的专业社区,关注大语言模型(LLM)的发展和应用落地,聚焦LLM及AI技术的市场研究和开发者生态。
李飞飞团队开源Spark 2.0 突破手机端3D渲染瓶颈
手机也能畅游虚拟3D世界了!李飞飞团队开源核心技术Spark 2.0,实现普通设备通过浏览器流畅访问高精度3D场景。
高精度3D场景通常由上亿数据点构成,普通设备难以承载。Spark 2.0作为高效优化引擎,通过三大核心技术解决此问题:
智能细节调控:采用连续细节层次(Continuous LoD),依据视角动态调整渲染精度。近处区域高清呈现,远处简化处理,确保帧率稳定,避免因数据过载导致卡顿。
渐进式数据加载:优先传输基础轮廓,随着视角移动实时补充细节,用户打开场景近乎瞬时完成,无需等待完整下载。
高效文件格式:创新.RAD格式优化存储与读取效率,如同标准化集装箱,大幅提升数据处理速度。
Spark 2.0适配主流3D框架Three.js及WebGL2标准,兼容iPhone、安卓设备和VR眼镜。电商、教育、房地产等行业可低成本构建交互式3D空间,消费者能直接通过网页“漫步”商品展厅,大幅降低3D内容开发门槛。
作为李飞飞世界模型战略的关键一环,Spark 2.0打通了AI生成3D内容到大众访问的最后链路,使亿级点云场景在浏览器中实现视频级流畅体验。其开源特性有望推动数字世界交互方式革新。
3D渲染技术新范式:高斯溅射替代多边形
三维高斯溅射(3DGS)技术通过数百万半透明椭球体构建场景,取代传统多边形网格。每个椭球体携带坐标、缩放半径、颜色及不透明度等属性,基于高斯分布实现逼真渲染。
Spark 2.0构建于Three.js框架和WebGL2标准,解决现有网页渲染引擎短板:支持多模型无缝拼接、动态动画,并实现跨设备运行。其渲染管线采用画家算法,按深度排序椭球体后逐层合成,确保视觉连贯性。
应对海量数据的核心突破
Spark 2.0通过三重技术打破设备性能限制:
连续细节树系统:建立椭球体层级结构,根节点为整场概览,叶节点为精细元素。系统根据渲染预算(如50万-250万点/帧)实时筛选最优节点组合,保障帧率稳定。算法采用Web Worker后台线程高效处理,不受数据总量影响。
视觉焦点优化:聚焦屏幕中央区域分配高清数据,边缘与后方场景使用粗糙椭球体。开发者可通过参数灵活控制全分辨率范围、边缘模糊度等细节,实现算力精准分配。
智能分层算法:提供浏览器端Tiny-LoD与离线Bhatt-LoD两种方案。前者基于空间网格快速合并数据点,后者通过统计学重叠度优化合并路径,在压缩数据的同时保障过渡平滑性。
高效传输与显存管理革新
RAD文件格式突破传统PLY/SPZ局限:首部JSON元数据实现随机访问;数据切分6.5万点/块的空间分区结构;采用按列压缩存储,千万元素仅需200MB。打开场景时先加载根节点块,随即展现完整框架,后续细节随动效渐进呈现。
显存虚拟化技术划定固定内存池(如1600万点),通过虚拟页表动态调度数据块。采用末位淘汰机制,当新数据流入时自动清除低优先级缓存,确保图形处理器安全运行。该设计使浏览器化身“无限空间容器”,复合三维世界的探索体验始终流畅。
Spark 2.0将手机浏览器推升为通用3D入口,空间智能时代加速来临。
参考资料:
https://www.worldlabs.ai/blog/spark-2.0
https://github.com/sparkjsdev/spark/

