题目:Identifying rural roads in remote sensing imagery: From benchmark dataset to coarse-to-fine extraction network—A case study in China
期刊:ISPRS Journal of Photogrammetry and Remote Sensing (IF = 12.2)
论文:https://doi.org/10.1016/j.isprsjprs.2025.11.010
数据/代码:https://rsidea.whu.edu.cn/resource_sharing.htm
年份:2025
单位:西安科技大学,武汉大学,电子科技大学
创新点
构建了首个中国大规模农村道路基准数据集WHU-CR,包含130,412对高分辨率图像,覆盖14个省份七大粮食主产区,涵盖多种道路类型和复杂场景,为农村道路提取研究提供了高质量数据基础。
提出了从粗到精的两阶段框架NANet,通过定位阶段的LACS(局部轴向上下文自注意力)和GFA(全局特征聚合)模块,有效缓解了极窄道路在深度编码中的特征损失问题,保持了多尺度全局一致性。
设计了创新的前景-背景反向注意力机制(FBRA),在细化阶段通过双路径协同策略,显著增强低对比度、弱纹理道路的显著性,同时抑制背景干扰,提升了道路边界清晰度和结构完整性。
在WHU-CR和DeepGlobe数据集上均达到最优性能,Road IoU分别达到55.24%和70.29%,并在大规模实际应用中验证了强泛化能力和实用性,相比现有方法在窄路提取和拓扑连通性方面具有明显优势。
背景
农村道路是支撑农业生产和农村社会经济发展的重要基础设施,对推进乡村振兴和全球可持续发展具有不可或缺的作用。然而,现有的道路制图产品如OpenStreetMap在农村地区往往缺乏足够覆盖,导致道路网络不完整,限制了下游应用。随着高分辨率遥感和人工智能技术的快速发展,虽然已有大量通用道路提取方法被提出,但农村道路提取仍面临严峻挑战:这些道路通常极窄(在高分辨率影像中仅占几个像素宽),在深度特征编码过程中容易导致关键像素衰减或丢失;同时农村道路呈现低对比度、弱纹理特征,与周围环境(如裸土、植被)光谱相似度高,进一步降低了可区分性。这些综合因素使得窄且光谱相似的农村道路提取极其困难,常导致边界模糊、不连续甚至道路段缺失,严重影响了道路网络的拓扑连通性和结构完整性。
为应对这些挑战,本文提出了针对农村道路提取的从粗到精两阶段框架NANet,并构建了大规模中国农村道路基准数据集WHU-CR,为农村道路提取研究提供了有效解决方案和高质量数据支撑。
数据
WHU-CR数据集
数据集基本信息
WHU-CR是首个专门针对中国农村道路提取的大规模基准数据集。数据来源于Google Earth高分辨率遥感影像,空间分辨率为0.3-0.8米,每张图像裁剪为512×512像素,配有详细的语义分割标注。
地理覆盖范围
数据集从中国七大粮食主产区选取14个省份,包括新疆、宁夏、陕西、青海、四川、广西、湖北、湖南、江苏、浙江、河北、山东、吉林和黑龙江,涵盖西北、西南、青藏、黄淮海、长江流域、东南和东北等不同地理环境,确保了数据的代表性和多样性。
数据规模
数据集总计130,412对图像-标注对,是目前中国最大的农村道路数据集。按3:2比例划分为训练集79,000对和测试集51,412对,图像块级别无重叠确保数据独立性。
场景分布
农田场景占45%,村庄场景占45%,山区场景占5%,其他场景(林地等)占5%,充分代表中国农村地区的环境多样性。
道路类型分布
水泥路占43%,沥青路占29%,土路占24%,其他类型占4%,涵盖了中国农村常见的各类道路形态。
标注质量控制
所有标注员经过标准化培训,每个图像至少由两名标注员独立标注,交叉验证一致性率超过90%,专家审核确保准确性。
特殊子集
WHU-CR-Type子集包含5,000对图像,专门标注水泥路、沥青路和土路三种类型,用于评估模型在不同道路类型上的性能。
数据集特点与挑战
农村道路普遍极窄(仅几个像素宽),呈现低对比度和弱纹理特征,土路与裸土光谱相似度高,铺装道路常混有土壤成分,这些特点使WHU-CR成为极具挑战性的基准数据集。
方法
整体架构
NANet采用从粗到精的两阶段框架,模拟人工标注过程:先识别大致道路区域,再细化边界。使用预训练ResNeSt-50作为编码器,分为定位阶段和细化阶段。
定位阶段
局部轴向上下文自注意力模块(LACS)
设计目的: 解决窄道路在深度编码中的特征损失问题。
结构组成: 包含五条并行分支,前两条为残差分支保留低层信息,后三条为增强分支。输入先通过1×1卷积降维至64通道。
多尺度捕获: 增强分支使用不同核大小的卷积(1×3/3×1、1×5/5×1、1×7/7×1)捕获水平和垂直方向的细长道路,配合不同扩张率的扩张卷积(扩张率3、5、7)扩大感受野。
轴向注意力: 核心创新是轴向感知块(AAB),沿水平和垂直轴分别计算注意力权重,选择性增强道路相关特征。
特征融合: 所有分支输出拼接后经1×1卷积,与第一分支残差连接得到最终增强特征。
全局特征聚合模块(GFA)
设计目的: 平衡细粒度细节和全局上下文,克服单层特征表示局限。
处理流程: 接收三个不同分辨率的LACS特征(f'3、f'4、f'5),通过渐进式上采样和逐元素乘法增强跨尺度交互。最低分辨率特征f'5逐步上采样与高分辨率特征融合。
输出结果: 增强特征拼接后经多个3×3卷积处理,生成全局聚合特征r5,为细化阶段提供全局上下文指导。
细化阶段
前景-背景反向注意力模块(FBRA)
核心创新: 通过双路径协同机制显式建模前景-背景关系,同时增强道路特征和抑制背景干扰。
前景路径: 调整特征f'i分辨率与全局特征ri对齐后拼接,经卷积处理输出前景特征响应Ri_fg,整合语义和空间信息。
背景路径: 用Sigmoid激活ri生成注意力权重图Ai,计算反向权重Wi(1-Ai)与f'i逐元素相乘,有效抑制背景区域,输出背景特征响应Ri_bg。
双路径融合: Ri_fg和Ri_bg加权融合生成优化特征Xi,逐层消除已预测道路区域,挖掘补充细节。
多尺度细化: FBRA在多个解码尺度迭代应用,由GFA全局特征r5指导,与LACS多尺度特征交互,渐进式生成清晰
深度监督
监督层级: 对五个侧输出(D0-D4)应用监督,D0整合其余四个输出,所有输出上采样至真值分辨率。
损失函数: 联合BCE损失(优化像素级准确性)和Dice损失(关注整体分割和边界)。
权重优化: 最优配置为D0=1.3、D1=1、D2=0.7、D3=0.7、D4=1,非均匀权重强调主输出同时引导辅助分支。
协同机制
LACS减轻编码阶段特征损失,GFA加强全局结构表示,FBRA在解码阶段逐步增强道路显著性,三者协同配合深度监督策略,有效保留细粒度细节,增强道路网络空间连续性,特别适合复杂农村环境中的窄道路提取。
结果与分析
NANet在WHU-CR和DeepGlobe两个数据集上的所有评估指标(Recall、F1-score、Road IoU和Connectivity)均达到最优性能,相比现有先进方法在Road IoU上取得显著提升,特别是在窄道路和拓扑连通性方面表现出明显优势。大规模实际应用验证表明,NANet提取的农村道路网络在完整性和结构连续性上显著优于OpenStreetMap和高德地图等现有地图产品,展现出强大的泛化能力和实用价值,且在不同道路类型(水泥路、沥青路、土路)上保持稳定性能,其中在最具挑战性的土路提取上优势最为突出。
文章授权转载公众号:遥感与深度学习
- END -





