

PointMamba: 点云分析的简单状态空间模型

极市平台

2024-03-22

↑ 点击蓝字关注极市平台

作者丨LMD@知乎（已授权）

来源丨https://zhuanlan.zhihu.com/p/687191399

编辑丨极市平台

极市导读

PointMamba作为一个新颖的点云分析工具，通过其高效的全局建模能力和简洁的模型结构，在3D视觉任务中展现了巨大的潜力。 >>加入极市CV技术交流群，走在计算机视觉的最前沿

在这里向大家介绍我们的最新工作：PointMamba: A Simple State Space Model for Point Cloud Analysis。状态空间模型作为序列建模的新方法最近在许多领域有了积极的进展，在本文中我们构建了一个具有全局建模和线性复杂性的3D点云分析新框架，性能优于基于 vanilla Transformer 的同类工作，同时显著节省了约 44.3% 的参数和 25% 的 FLOPs。据我们所知，PointMamba是第一个把状态空间模型运用到点云分析任务上的文章。论文、模型、代码均已开源，欢迎大家引用和star✨。

论文：

https//arxiv.org/abs/2402.10739

代码：

https//github.com/LMD0311/PointMamba

引言

点云数据的不规则性和稀疏性一直是3D视觉领域中的难题。虽然Transformer基于其强大的全局信息建模能力，在点云分析任务中展现了潜力，但其计算复杂度随着输入长度的增加而显著增长，限制了其在长序列模型上的应用。在此背景下，我们提出了PointMamba，一个结合了状态空间模型（SSM）优势的框架，旨在通过具有线性复杂度的全局建模方法，克服现有技术的限制。

模型架构

Point Tokenizer: 与Point-BERT/Point-MAE类似，我们首先采用一个简单的Point Tokenizer来生成Point Patches，通过最远点采样（FPS）和K最近邻（KNN）算法将输入点云划分为一系列局部区域，然后将这些区域映射到特征空间中，形成Point tokens。

Reordering Strategy: 为了让SSM能够更有效地捕获点云的全局结构，我们提出了一种重排序策略。这一策略通过基于Point Patches的几何中心坐标，沿 x,y,zx,y,z 轴顺序的几何顺序重新组织Point tokens，以逻辑上的扫描顺序来增强模型的全局建模能力。