

ICCV 2023｜沈春华团队提出SegPrompt：提示学习增强开放世界分割

极市平台

2023-08-30

↑ 点击蓝字关注极市平台

作者丨李太白@知乎（已授权）

来源丨https://zhuanlan.zhihu.com/p/651858313

编辑丨极市平台

极市导读

本文提出了包含Prompt learning机制的分割网络，在保持分割能力的同时，运用到类别信息。>>关注公众号，后台回复「极市干货」即可获取最新整理CV知识内容合集

论文链接：https://arxiv.org/abs/2308.06531

代码链接：https://github.com/aim-uofa/SegPrompt

这篇文章是由浙大和阿德莱德大学合作，在2023.8.12上传到arxiv上的文章，创新性强，解决的问题也非常有挑战性，值得一读。

背景

之前Open-World Entity Segmentation这篇文章提出了实体分割的概念,只注重分割对象的质量，而不关注对象的类别，在Photoshop这类图像编辑的软件中有着很好的用处。但是对于open-world instance segmentation这个任务来说还远远不够，需要解决在开放世界中未见过的物体分割，以及对分割的物体生成标签。

为此，本文提出了包含Prompt learning机制的分割网络，在保持分割能力的同时，运用到类别信息。

本文的贡献

引入Prompt learning机制，它有效地使用类别信息来改进分割结果
第一个关注开放世界分割中的长尾效应
类别级的提示信息确实能够提升分割质量，能扩展到少样本的分割

文中将物体分为Known（训练集中有标注）、Seen （训练集中无标注，测试集有标签，看到了但不知道是啥）、Unseen（训练集没出现过，测试集中有标注，开放世界分割较常出现的问题）

方法

总览

模型主要为三个分支，Prompt Extraction Branch，Prompt-based Prediction Branch， Class-agnostic Branch。Prompt Extraction Branch以提示的形式提供类别级实例特性，然后Prompt-based Prediction Branch使用这些提示来预测相应的每类实例掩码，除了少数与提示相关的嵌入外，所有参数都与类别无关的分割网络共享。