点击下方名片,获取你的下一个灵感实例。
在计算机视觉领域,3D部件分割一直是形状分析、建模与机器人交互的核心任务。当面对新类别物体仅有少量标注样本时,传统方法往往陷入精度瓶颈。近期,来自国内高校的研究团队提出了一种名为SegGraph的创新框架,通过构建SAM分割图结构,在PartNet-E数据集上实现了72.8%的mIoU成绩,较现有最优方法提升6.9%,尤其在小部件分割上表现惊艳。
论文信息
题目: SegGraph: Leveraging Graphs of SAM Segments for Few-Shot 3D Part Segmentation
SegGraph:基于SAM分割图的小样本三维部件分割方法
作者:Yueyang Hu, Haiyong Jiang, Haoxuan Song, Jun Xiao, Hao Pan
源码:https://github.com/YueyangHu-2000/SegGraph
为什么3D部件分割需要新方案?
现有基于2D基础模型的3D分割方法存在两大痛点:
-
几何关联缺失:简单将多视角2D标签聚合到3D域,忽略了三维空间中部件的结构关系,导致分割不完整和边界混乱 -
视角质量差异:不同角度渲染的图像中,SAM分割质量差异显著,小部件在不利视角下容易被误分割
如图1所示,传统方法要么依赖2D标签投票(图1a),要么通过三维蒸馏(图1b)或特征聚合(图1c)处理,均难以平衡精度与效率。
图1:现有方法与SegGraph的技术路线对比
SegGraph核心创新:用图结构串联SAM分割块
SegGraph的突破在于将3D形状的多视图SAM分割片段转化为图节点,通过建模它们的空间关系实现特征传播。其总体框架如图2所示:
图2:SegGraph方法总体框架图
创新点1:SAM分割图的构建艺术
研究团队发现,SAM生成的分割掩码蕴含丰富的几何线索:
-
跨视图重叠的分割块通常属于同一部件(重叠关系Eo) -
相邻分割块天然描绘部件边界(邻接关系Ea)
如图3所示,这些关系被转化为图的边连接,形成类似"图册"的结构,让计算机能像人类一样理解部件间的空间关联。
图3:SAM分割图结构示例(虚线为重叠关系,实线为邻接关系)
创新点2:让低质量视角"闭嘴"的加权机制
并非所有视角的分割都可靠!如图4所示,笔记本电脑键盘在某些角度会被严重误分割。SegGraph设计了视角质量感知模块,通过计算点法线与相机方向的夹角,自动降低低质量分割块的权重:
图4:不同视角下的SAM分割质量差异(左为差视角,右为优视角)
创新点3:双分支GATv2的特征传播
针对重叠与邻接两种关系的不同特性,SegGraph采用两个独立的GATv2网络分别处理,再通过分段编码模块融合点的几何特征(法向量、相对位置),让特征在图中精准流动。
实验结果:小部件分割提升超20%
在PartNet-E数据集的45个类别上,SegGraph以显著优势超越所有基线方法:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
| 本文方法 | SegGraph | 72.8% |
尤其在小部件分割上,SegGraph展现出惊人能力。如表2所示,咖啡机按钮、遥控器按键等精细结构的分割精度提升超过20%:
表2:小部件分割性能对比
图5的定性结果更直观显示优势:钟表指针、锅盖把手等细节部件在SegGraph中得到完美分割,而传统方法往往丢失这些信息。
图5:不同方法的分割结果对比(上为SegGraph,下为基线方法)
效率与泛化能力同样出色
SegGraph不仅精度高,还兼顾了实用性:
-
仅需8个标注样本即可训练 -
推理速度达1.46秒/形状,是同类方法的3倍 -
支持CLIP/DINOv2/GLIP等多种基础模型,更换特征提取器仍保持性能优势
特征可视化结果(图6)显示,经SegGraph处理的3D特征在不同部件间具有清晰的可分离性,即使是训练集中未标注的区域也能展现部件级区分度。
图6:特征可视化对比(左为原始特征,右为SegGraph处理后)
未来展望
尽管表现优异,SegGraph仍有改进空间:目前框架难以处理3D模型的内部遮挡结构,且未支持多尺度部件粒度。研究团队计划在未来工作中构建层次化语义表示,进一步拓展其在复杂场景中的应用。

