大数跨境
0
0

3D语义分割新突破,层级一致性有了数学保障

3D语义分割新突破,层级一致性有了数学保障 DeepTech深科技
2025-12-01
9
导读:为未来三维视觉技术的实现提供了可能性。

近期,西南交通大学李天瑞教授与李崇寿副教授团队提出一种新型深度层次化学习框架(DHL),首次从数学角度定义“层级一致性”,并揭示层内预测与层间一致性的理论关联。

该框架专为3D点云语义分割设计,模拟人类认知的层次结构,提升机器对三维场景的理解能力。李崇寿表示:“DHL的本质是赋予机器分层观察世界的逻辑,并填补了3D层级学习在数学建模上的空白”。

技术在自动驾驶、城市规划、机器人导航、数字孪生及具身智能等领域具备广泛应用潜力。例如,在自动驾驶中,激光雷达需兼顾远距离探测与细节识别,结合层次结构可提升关键场景的识别精度与效率,增强系统安全性。

突破传统局限:实现层级一致性的自动融合

针对AI在处理多粒度信息时易忽略关联性、难以区分几何相似但语义不同的物体等问题,研究团队从概率视角定义“层级一致性”——若模型预测某点属于子类(如“汽车”)的概率为90%,则其父类(如“交通工具”)的预测概率不低于90%。

为此,团队引入聚合矩阵,实现分类索引的自动校准,在无需人工干预的情况下融合层级关系,明确子类归属,突破以往仅能定性分析的限制。该方法同时满足“属于子集必属于父集”和“不属于父集则不属于子集”的双向逻辑,确保推理过程符合层级约束。

DHL架构设计:可嵌入通用模型的双模块机制

为提升精度与效率,DHL框架包含两个核心模块:
一是层次嵌入融合模块(HEFM),建立“自上而下”与“自下而上”的双向信息通道,支持嵌入任意3D分割模型;
二是自动构建类别层级模块,利用视觉语言模型理解类别语义并生成层级目录,实现“自动编目录”功能。

实验验证:显著提升细分精度与整体性能

在多个含层次标注的3D数据集上的测试表明,DHL相较传统单层分类器在平均交并比(mIoU)和总体准确率方面均有提升。

具体案例显示:在Campus3D数据集中,传统方法将房屋屋顶误标为“地面”,而DHL准确识别为“屋顶”并关联至“建筑物”大类;
在ScanNet200数据集,椅子、桌子等细类的分割精度提高8%-12%;
在PartNet家电零件细分任务中,冰箱的mIoU提升至52.7%。

图丨李崇寿(来源:李崇寿)

图丨DHL 架构由三部分组成:编码器与多解码器、层次嵌入融合模块和层次相干损失(来源:IJCV)

图丨 Campus3D 中的类层级示例(来源:IJCV)

图丨相关论文(来源:IJCV)

论文《面向三维语义分割的深度层次学习》发表于计算机视觉顶刊 International Journal of Computer Vision(IJCV)。第一作者为西南交通大学李崇寿副教授,通讯作者为香港城市大学研究助理教授李欣科。

未来,团队将持续深化几何与空间维度的层次学习理论,并拓展至时间维度(4D),旨在动态环境中同步跟踪位置变化与保持层级结构稳定。

【声明】内容源于网络
0
0
DeepTech深科技
DeepTech 是一家专注新兴科技的资源赋能与服务机构,以科学、技术、人才为核心,通过科技数据与咨询、出版与影响力、科创资本实验室三大业务板块,推动科学与技术的创新进程。DeepTech 同时是《麻省理工科技评论》中国区独家运营方。
内容 4824
粉丝 0
DeepTech深科技 DeepTech 是一家专注新兴科技的资源赋能与服务机构,以科学、技术、人才为核心,通过科技数据与咨询、出版与影响力、科创资本实验室三大业务板块,推动科学与技术的创新进程。DeepTech 同时是《麻省理工科技评论》中国区独家运营方。
总阅读25.2k
粉丝0
内容4.8k