大数跨境
0
0

NeurIPS 2025 超越3DGS!GeoSVR:高精度三维表面重建

NeurIPS 2025 超越3DGS!GeoSVR:高精度三维表面重建 极市平台
2025-09-29
0
↑ 点击蓝字 关注极市平台
作者丨CVer
来源丨CVer
编辑丨极市平台

极市导读

 

GeoSVR 用“体素不确定性+表面正则”两大杀器,让稀疏体素也能重建出锐利、完整的 3D 表面——DTU 误差最低,Tanks & Temples F1 0.56 创纪录,训练仅 0.8 小时,给机器人、XR 提供一条无需稠密点云的新重建路径。>>加入极市CV技术交流群,走在计算机视觉的最前沿

在计算机视觉与图形学中,表面重建是一个长期未解的难题:给定一组多视角图像,能否重建出高精度、几何清晰、细节丰富的 3D 模型?

近年来,NeRF、SDF与 3D Gaussian Splatting (3DGS) 等方法大放异彩,让 AI 能从图像中恢复出三维世界。但问题也随之浮现:

  • 初始化依赖:3DGS 高效,但强烈依赖高精度和覆盖度的点云初始化,点云缺陷会直接传递为几何误差与细节缺失。

  • 模糊边界:高斯基元天生边界并不锐利,难以保证几何表面的清晰性与一致性。

  • 外部先验难以融合:单目深度、法线等外部几何线索虽有帮助,但若不加选择地引入,往往放大噪声,破坏原本准确的几何。

于是一个问题被抛出:有没有一条新路径,不依赖复杂初始化,也能在保持效率的同时,实现真正精确、完整的表面重建?

北京航空航天大学、Rawmantic AI、虚拟现实新技术国家重点实验室、麦考瑞大学、RIKEN AIP 与东京大学的团队给出了他们的答案:

GeoSVR (Geometric Sparse Voxel Reconstruction) —— 一种全新的显式几何优化框架,探究稀疏体素的潜力,在几何准确性、细节捕捉和完整性上全面超越现有方法。该论文目前已被NeurIPS 2025接收为Spotlight。

论文:https://arxiv.org/abs/2509.18090

主页:fictionarry.github.io/GeoSVR-project/

代码:github.com/Fictionarry/GeoSVR

01 方法核心:驯服稀疏体素的两大设计

图1 GeoSVR方法流程

GeoSVR 在稀疏体素表达SVRaster的基础上,围绕几何约束与表面正则化提出了系统化设计,使体素能够在保证效率的同时,生成几何精确的表面。

1.1 体素不确定性深度约束 (Voxel-Uncertainty Depth Constraint)

  • 挑战:稀疏体素在没有几何先验时,容易出现局部表面错误;而外部深度信号(如单目深度估计)又往往带有噪声,若直接施加监督,可能导致几何结构进一步劣化。

  • 核心思路:GeoSVR 在引入深度约束之前,首先对具有清晰几何意义和三维边界的体素进行几何可靠性建模。即:先估计体素的不确定性,再决定监督强度。

    • 深度约束加权:将外部深度损失与不确定性结合

    • 效果:在几何歧义处借助外部信号校正,而在可信区域保持体素自身学习,避免过拟合噪声。

    • 不确定性建模:受不确定性和体素层级的紧密耦合的启发,GeoSVR抽象出一种层级感知的几何不确定性,其与体素八叉树的层级明确相关,表明具有关键几何形状的低层级体素会导致更高的不确定性。

优势:外部几何约束得以“选择性注入”,显著提升了鲁棒性与精确性。

图2 体素不确定性深度约束效果 

1.2 稀疏体素表面正则化 (Sparse Voxel Surface Regularization)

挑战:稀疏体素的表达天然是离散的,每个体素只作用于局部区域。如果缺乏约束,容易导致:

  • 局部过拟合,产生碎片化表面;

  • 渲染表面与真实几何不对齐,形成不准确的表面;

  • 大型体素主导几何表达几何,带来失真。

解决方案:GeoSVR 提出了三种互补的正则化策略:

1. 体素暂退

随机丢弃一部分体素,仅保留子集参与训练。

迫使模型利用更少的体素保持全局一致性,从而减少局部冗余,避免陷入碎片几何。

2. 表面修正

在渲染过程中显式检测射线与体素交界点,强制渲染表面与体素密度边界对齐。

相当于将几何表面锚定在体素分布之上,从而得到更锐利的几何边缘。

图3 表面修正说明及效果

3. 体素尺度惩罚

为体素尺度引入正则项,抑制过大体素对几何的错误主导。

使几何表达更加细粒度,避免大体素占据并“抹平”局部结构。

优势:通过全局一致性约束、边界校正与尺度控制,GeoSVR 有效提升了几何的锐度与稳定性。

02 实验结果:精准、完整、高效

GeoSVR 在多项权威数据集上全面超越现有方法:

1. DTU 数据集

  • Chamfer 距离全场最佳,几何精度领先;

  • 训练仅需 0.8 小时,远快于先前SOTA方法Geo-NeuS等隐式方法的 >12 小时。

2. Tanks and Temples数据集

  • GeoSVR 以 0.56 的 F1-score 成为目前最高精度方法;

  • 在复杂建筑与低纹理区域保持稳定重建。

3. Mip-NeRF 360数据集

  • 在新视角合成上保持与 3DGS 相当的高保真度;

  • 同时提供更精确的几何结构。

实验表明,GeoSVR取得的重建效果:

  • 更准:几何精度显著提升;

  • 更全:细节与完整性优于现有方法;

  • 更快:效率媲美 3DGS,远超隐式表达系列的工作。

03 意义与展望

eoSVR 展示了一个新的可能,在SDF与3DGS以外,稀疏体素也能支撑高质量表面重建,并通过显式不确定性约束建模与正则化设计,兼顾精度、完整性与效率。这一技术为 机器人感知、自动驾驶、数字孪生、虚拟现实 等应用提供了三维环境构建及数字资产支持。未来,进一步增强全局一致性与跨场景泛化能力,将是该方向的重要研究路径。


公众号后台回复“数据集”获取100+深度学习各方向资源整理

极市干货

技术专栏:多模态大模型超详细解读专栏搞懂Tranformer系列大视觉模型 (LVM) 解读扩散模型系列极市直播
技术综述:小目标检测那点事大模型面试八股含答案万字长文!人体姿态估计(HPE)入门教程

点击阅读原文进入CV社区

收获更多技术干货

【声明】内容源于网络
0
0
极市平台
为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
内容 8155
粉丝 0
极市平台 为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
总阅读197
粉丝0
内容8.2k