大数跨境
0
0

论文秀#25IJCAI|Mixture-of-QueriesTransformer如何破解伪装难题

论文秀#25IJCAI|Mixture-of-QueriesTransformer如何破解伪装难题 蚂蚁技术AntTech
2025-08-21
0



国际人工智能联合会议(International Joint Conference on Artificial Intelligence,简称IJCAI)是人工智能领域最具影响力和权威性的国际学术会议之一。IJCAI 2025将于2025年8月16日至22日在加拿大蒙特利尔(Montreal, Canada)召开,本届会议共收到5404篇有效投稿,接收率为19.3%。本期论文秀Live聚焦伪装目标检测与分割的前沿研究,深度解读一项突破性成果——Mixture-of-Queries Transformer(MoQT),揭示其如何通过“查询间的合作”与“频域增强”破解伪装难题



Mixture-of-Queries Transformer: Camouflaged Instance Segmentation via Queries Cooperation and Frequency Enhancement / Mixture-of-Queries Transformer:利用查询间的合作和频域增强进行伪装目标实例分割


由于伪装实例与周围环境的高度相似性,伪装实例分割以及广泛的类伪装场景(如伪造检测等)是一项具有挑战性的相关任务。以前的方法忽略了伪装对象的颜色和轮廓性质,然后本能地决定每个候选对象。在本文中,我们基于两个关键设计(频率增强特征提取器和混合查询解码器),以端到端的方式为伪装实例分割贡献了一个Mixture-of-Queries Transformer。首先,频率增强特征提取器负责捕获频域中伪装的线索。为了暴露伪装的实例,提取器增强了轮廓的有效性,消除了干扰颜色,同时获得了增强的特征。其次,混合查询解码器利用每一层中的多个新初始化的查询专家(被认为是专家的一组查询),用于协作地发现伪装的特征。这些专家协作使用混合查询机制生成输出,并按层次细化到细粒度级别,以获得更准确的实例掩码。耦合这两个组件使MoQT能够使用多个专家在空间和频率域整合伪装物体的有效线索。广泛的实验结果表明,我们的MoQT在COD10K和NC4K数据集上都优于19种最先进的伪装实例分割方法。



论文亮点聚焦


1

频域魔法:首创频域-空间双域特征融合框架,破解伪装目标“隐形衣”。

2

协作解码:多查询专家动态协作,实现像素级精准分割与边界优化。

3

通用潜力:技术可扩展至深度伪造检测、医学影像分析等类伪装场景。


本期论文秀Live邀请到论文第一作者分享该技术的设计思路与验证过程。他们将深入解析频域增强与查询协作机制的核心原理,并展示模型在实际应用场景中的卓越性能。



冯巍巍:蚂蚁集团大安全机器智能高级算法工程师


【直播观看指南】直播速约,锁定前沿!


⏰ 观看时间:2025年8月21日 18:00-19:00

👀 观看平台:微信视频号【蚂蚁技术AntTech】、【蚂蚁技术研究院】 B站【蚂蚁技术研究院】同步直播,敬请预约关注!


【声明】内容源于网络
0
0
蚂蚁技术AntTech
科技是蚂蚁创造未来的核心动力
内容 1081
粉丝 0
蚂蚁技术AntTech 科技是蚂蚁创造未来的核心动力
总阅读464
粉丝0
内容1.1k