
-
论文标题: WWE-UIE: A Wavelet & White Balance Efficient Network for Underwater Image Enhancement -
作者: Ching-Heng Cheng, Jen-Wei Lee, Chia-Ming Lee, Chih-Chung Hsu -
机构: 中国台湾成功大学、中国台湾阳明交通大学 -
论文地址: https://arxiv.org/abs/2511.16321 -
项目主页: https://github.com/chingheng0808/WWE-UIE -
会议: WACV 2026
大家好!今天想和大家聊一篇非常有趣的水下图像增强论文——《WWE-UIE》。水下世界神秘又迷人,但水下拍摄的图像和视频往往是一片“蓝绿滤镜”下的模糊景象,色彩失真、细节丢失,这给海洋科考、水下机器人导航等应用带来了巨大挑战。
为了让水下图像“重见天日”,研究者们提出了各种增强方法。然而,很多效果好的模型计算量巨大,难以在资源受限的设备上实时运行。来自中国台湾成功大学和中国台湾阳明交通大学的研究者们巧妙地提出了一个名为WWE-UIE的网络,全称是Wavelet & White Balance Efficient Network for Underwater Image Enhancement。顾名思义,它将小波变换(Wavelet)和白平衡(White Balance)这两个经典技术与轻量级神经网络相结合,旨在实现一个既高效又高质量的水下图像增强方案。
研究背景与动机
光线在水中传播时,不同波长的光被吸收和散射的程度不同。红光衰减最快,而蓝绿光能穿透得更深,这就导致了水下图像普遍存在严重的色偏和对比度下降问题。
过去的增强方法大致可以分为两类:
-
传统方法:基于物理模型或图像先验,如暗通道先验(Dark Channel Prior)、Retinex等。这类方法物理意义明确,但对多变的水下环境泛化能力较差,容易产生伪影。 -
学习方法:近年来,基于深度学习的CNN或Transformer模型成为主流。它们能从数据中学习复杂的映射关系,效果显著。但像UDAFormer、SMDR-IS这类基于Transformer的模型,为了追求全局建模能力,往往参数量和计算量(FLOPs)惊人,限制了它们在实时场景(如水下机器人)中的应用。
如何在保证增强效果的同时,大幅降低模型的计算复杂度,是当前UIE领域亟待解决的痛点。WWE-UIE正是为了应对这一挑战而生,它没有追随“越大越好”的模型设计风潮,而是另辟蹊径,通过融合三个可解释的先验知识来赋能一个紧凑的CNN网络。
从上图的性能对比中可以直观地看到,WWE-UIE在性能(PSNR)和计算量(FLOPs)之间取得了极佳的平衡,以远低于许多主流方法的计算开销,达到了极具竞争力的增强效果。
WWE-UIE的核心方法
WWE-UIE的整体架构是一个U-Net,但其核心在于巧妙地在网络中集成了三个“法宝”:自适应白平衡先验、基于小波的增强模块(WEB)和梯度感知的融合模块(SGFB)。
自适应白平衡先验 (Adaptive White Balance Prior)
水下图像的蓝绿色偏是首要处理的难题。作者采用了一种基于“灰度世界假设”(Gray-World assumption)的自适应白平衡算法作为预处理。该假设认为,一幅色彩丰富的图像中,所有颜色的平均值趋于灰色。通过这个先验,可以估计出环境光,并对图像进行校正。
但作者并没有简单地用白平衡后的图像替换原图,而是设计了一个可学习的融合策略。将原始输入图像 和白平衡校正后的图像 进行加权融合:
其中, 是一个逐通道的可学习参数。这种“软融合”的方式,让网络可以自适应地决定在每个颜色通道上保留多少原始信息和借鉴多少白平衡校正信息,既纠正了严重的色偏,又避免了过度校正,增强了模型的鲁棒性。
小波增强模块 (Wavelet-based Enhancement Block, WEB)
水下图像的降质体现在两个层面:低频的全局颜色和结构变化,以及高频的纹理细节丢失。傅里叶变换虽然能分析频率,但会丢失空间信息。而离散小波变换(Discrete Wavelet Transform, DWT)则能同时保留频率和空间信息,非常适合处理这类问题。
WEB模块的核心就是利用DWT将特征图分解为四个子带:
-
LL (Low-Low): 低频分量,代表了图像的整体结构和轮廓。 -
LH (Low-High): 水平方向的高频分量,代表垂直方向的边缘和细节。 -
HL (High-Low): 垂直方向的高频分量,代表水平方向的边缘和细节。 -
HH (High-High): 对角线方向的高频分量,代表对角线方向的细节。
这一分解过程通过四个固定的Haar小波滤波器卷积实现。
分解后,WEB将这四个子带的特征拼接(Concat)起来,通过一个 卷积进行信息融合和降维,再经过后续处理模块并与原始输入特征相加。通过这种方式,网络可以对图像的结构和纹理进行差异化处理,有针对性地恢复不同频率上的信息,从而在保持结构一致性的同时,有效增强模糊的细节。
上图清晰地展示了WEB模块如何将特征图分解为结构(LL)和纹理(LH, HL, HH)部分。
Sobel梯度融合模块 (Sobel Gradient Fusion Block, SGFB)
水中的悬浮颗粒物会导致光线散射,造成图像模糊,尤其是边缘和轮廓的锐度会大幅下降。为了解决这个问题,作者设计了SGFB模块来显式地保留和增强边缘结构。
该模块的核心是利用经典的Sobel算子来提取特征图的梯度信息。Sobel算子可以计算水平和垂直方向的一阶梯度,从而有效地捕捉边缘。
其中 和 分别是水平和垂直方向的Sobel卷积核。提取出的梯度特征 经过卷积和Sigmoid激活函数后,会生成一个“门控图” (Gating Map) 。这个图会高亮边缘区域。
最后,通过一个可学习的标量 和门控图 来动态地融合原始特征 和经过梯度加权的特征 :
这种设计通过门控图实现了像素级的精细调节(在边缘区域增强特征),同时通过标量 实现了模块级的粗粒度控制(平衡梯度增强的整体强度)。相比于一些隐式学习注意力的方法,SGFB的梯度引导更加明确和高效。
实验效果与分析
作者在多个公开的全参考和无参考水下图像数据集上进行了广泛的实验,包括UIEB、LSUI、UFO-120、EUVP、Challenging-60和U45等。
定量与定性分析
如下表所示,在全参考数据集上,WWE-UIE在PSNR和SSIM指标上取得了与SOTA方法(如UDAFormer, SMDR-IS)相当甚至更优的成绩。但最关键的是,它的参数量(Params)和计算量(FLOPs)远低于这些重量级模型。例如,与UDAFormer相比,WWE-UIE的参数量仅为其1/15左右,FLOPs仅为其1/14左右,但性能却不相上下,甚至在某些数据集上更优。
在无参考的真实水下图像上,WWE-UIE同样表现出色,尤其是在色彩保真度上。在Color-Check7数据集上,它的CIEDE2000色彩差异得分最低(10.0979),说明其色彩恢复最接近真实参考。
从可视化的结果来看,WWE-UIE处理后的图像颜色自然,细节清晰,有效去除了水下模糊和色偏,效果令人印象深刻。无论是合成数据还是真实场景,其表现都非常稳健。
在CIE xyY色彩空间中,可以看到WWE-UIE的结果(Our)在色度和亮度分布上都更接近参考图像(Reference),进一步证明了其出色的色彩校正能力。
消融实验
作者通过消融实验验证了每个模块的有效性。
-
模块贡献:移除白平衡先验、WEB模块或SGFB模块都会导致性能下降,证明了这“三驾马车”缺一不可。 -
损失函数:移除任何一项损失函数也都会损害最终效果。特别是,移除HVI颜色损失对PSNR影响最大,说明在合适的颜色空间进行监督至关重要。


有趣的是,作者还发现,在网络块中先使用WEB进行多频带特征提取,再用SGFB进行边缘纹理细化,这样的顺序效果更好。
泛化能力测试
一个好的模型不应该只在自己的“专业领域”表现出色。作者还将 WWE-UIE 应用于低光增强和去雾任务,结果令人惊喜。
如上图所示,未经任何针对性训练的 WWE-UIE 在处理低光和雾天图像时,也表现出了不错的提升效果,这说明其集成的物理先验具有一定的通用性,能够推广到更广泛的图像复原任务中。
总结
总的来说,WWE-UIE这篇工作给我最大的启发是,在深度学习“军备竞赛”日益激烈的今天,回归本源、巧妙地将领域先验知识与简洁的网络架构相结合,同样能迸发出巨大的能量。它没有盲目堆叠复杂的模块,而是针对水下图像降质的核心痛点——色偏、模糊、细节丢失——提出了三个轻量而精准的解决方案。
最终,WWE-UIE以极低的计算成本实现了SOTA级别的性能,为水下图像增强的实时应用铺平了道路,展现了“小而美”模型的魅力。
大家对这种融合经典先验的方法怎么看?欢迎在评论区留下你的看法!

