WACV 2026 | 告别水下“滤镜感”，WWE-UIE以小博大，实现高清、实时水下图像增强- 大数跨境

首页

WACV 2026 | 告别水下“滤镜感”，WWE-UIE以小博大，实现高清、实时水下图像增强

我爱计算机视觉

2025-11-22

170

导读：轻量高效，水下图像实时增强新思路！

论文标题: WWE-UIE: A Wavelet & White Balance Efficient Network for Underwater Image Enhancement
作者: Ching-Heng Cheng, Jen-Wei Lee, Chia-Ming Lee, Chih-Chung Hsu
机构: 中国台湾成功大学、中国台湾阳明交通大学
论文地址: https://arxiv.org/abs/2511.16321
项目主页: https://github.com/chingheng0808/WWE-UIE
会议: WACV 2026

大家好！今天想和大家聊一篇非常有趣的水下图像增强论文——《WWE-UIE》。水下世界神秘又迷人，但水下拍摄的图像和视频往往是一片“蓝绿滤镜”下的模糊景象，色彩失真、细节丢失，这给海洋科考、水下机器人导航等应用带来了巨大挑战。

为了让水下图像“重见天日”，研究者们提出了各种增强方法。然而，很多效果好的模型计算量巨大，难以在资源受限的设备上实时运行。来自中国台湾成功大学和中国台湾阳明交通大学的研究者们巧妙地提出了一个名为WWE-UIE的网络，全称是Wavelet & White Balance Efficient Network for Underwater Image Enhancement。顾名思义，它将小波变换（Wavelet）和白平衡（White Balance）这两个经典技术与轻量级神经网络相结合，旨在实现一个既高效又高质量的水下图像增强方案。

研究背景与动机

光线在水中传播时，不同波长的光被吸收和散射的程度不同。红光衰减最快，而蓝绿光能穿透得更深，这就导致了水下图像普遍存在严重的色偏和对比度下降问题。

过去的增强方法大致可以分为两类：

传统方法：基于物理模型或图像先验，如暗通道先验（Dark Channel Prior）、Retinex等。这类方法物理意义明确，但对多变的水下环境泛化能力较差，容易产生伪影。
学习方法：近年来，基于深度学习的CNN或Transformer模型成为主流。它们能从数据中学习复杂的映射关系，效果显著。但像UDAFormer、SMDR-IS这类基于Transformer的模型，为了追求全局建模能力，往往参数量和计算量（FLOPs）惊人，限制了它们在实时场景（如水下机器人）中的应用。

如何在保证增强效果的同时，大幅降低模型的计算复杂度，是当前UIE领域亟待解决的痛点。WWE-UIE正是为了应对这一挑战而生，它没有追随“越大越好”的模型设计风潮，而是另辟蹊径，通过融合三个可解释的先验知识来赋能一个紧凑的CNN网络。

从上图的性能对比中可以直观地看到，WWE-UIE在性能（PSNR）和计算量（FLOPs）之间取得了极佳的平衡，以远低于许多主流方法的计算开销，达到了极具竞争力的增强效果。

WWE-UIE的核心方法

WWE-UIE的整体架构是一个U-Net，但其核心在于巧妙地在网络中集成了三个“法宝”：自适应白平衡先验、基于小波的增强模块（WEB）和梯度感知的融合模块（SGFB）。

自适应白平衡先验 (Adaptive White Balance Prior)

水下图像的蓝绿色偏是首要处理的难题。作者采用了一种基于“灰度世界假设”（Gray-World assumption）的自适应白平衡算法作为预处理。该假设认为，一幅色彩丰富的图像中，所有颜色的平均值趋于灰色。通过这个先验，可以估计出环境光，并对图像进行校正。

但作者并没有简单地用白平衡后的图像替换原图，而是设计了一个可学习的融合策略。将原始输入图像和白平衡校正后的图像进行加权融合：

其中，是一个逐通道的可学习参数。这种“软融合”的方式，让网络可以自适应地决定在每个颜色通道上保留多少原始信息和借鉴多少白平衡校正信息，既纠正了严重的色偏，又避免了过度校正，增强了模型的鲁棒性。

小波增强模块 (Wavelet-based Enhancement Block, WEB)

水下图像的降质体现在两个层面：低频的全局颜色和结构变化，以及高频的纹理细节丢失。傅里叶变换虽然能分析频率，但会丢失空间信息。而离散小波变换（Discrete Wavelet Transform, DWT）则能同时保留频率和空间信息，非常适合处理这类问题。

WEB模块的核心就是利用DWT将特征图分解为四个子带：

LL (Low-Low): 低频分量，代表了图像的整体结构和轮廓。
LH (Low-High): 水平方向的高频分量，代表垂直方向的边缘和细节。
HL (High-Low): 垂直方向的高频分量，代表水平方向的边缘和细节。
HH (High-High): 对角线方向的高频分量，代表对角线方向的细节。

这一分解过程通过四个固定的Haar小波滤波器卷积实现。

分解后，WEB将这四个子带的特征拼接（Concat）起来，通过一个卷积进行信息融合和降维，再经过后续处理模块并与原始输入特征相加。通过这种方式，网络可以对图像的结构和纹理进行差异化处理，有针对性地恢复不同频率上的信息，从而在保持结构一致性的同时，有效增强模糊的细节。

上图清晰地展示了WEB模块如何将特征图分解为结构（LL）和纹理（LH, HL, HH）部分。

Sobel梯度融合模块 (Sobel Gradient Fusion Block, SGFB)

水中的悬浮颗粒物会导致光线散射，造成图像模糊，尤其是边缘和轮廓的锐度会大幅下降。为了解决这个问题，作者设计了SGFB模块来显式地保留和增强边缘结构。

该模块的核心是利用经典的Sobel算子来提取特征图的梯度信息。Sobel算子可以计算水平和垂直方向的一阶梯度，从而有效地捕捉边缘。

其中和分别是水平和垂直方向的Sobel卷积核。提取出的梯度特征经过卷积和Sigmoid激活函数后，会生成一个“门控图” (Gating Map) 。这个图会高亮边缘区域。

最后，通过一个可学习的标量和门控图来动态地融合原始特征和经过梯度加权的特征：

这种设计通过门控图实现了像素级的精细调节（在边缘区域增强特征），同时通过标量实现了模块级的粗粒度控制（平衡梯度增强的整体强度）。相比于一些隐式学习注意力的方法，SGFB的梯度引导更加明确和高效。

实验效果与分析

作者在多个公开的全参考和无参考水下图像数据集上进行了广泛的实验，包括UIEB、LSUI、UFO-120、EUVP、Challenging-60和U45等。

定量与定性分析

如下表所示，在全参考数据集上，WWE-UIE在PSNR和SSIM指标上取得了与SOTA方法（如UDAFormer, SMDR-IS）相当甚至更优的成绩。但最关键的是，它的参数量（Params）和计算量（FLOPs）远低于这些重量级模型。例如，与UDAFormer相比，WWE-UIE的参数量仅为其1/15左右，FLOPs仅为其1/14左右，但性能却不相上下，甚至在某些数据集上更优。