
摘要:针对地铁沿线地面沉降防治的问题,该文建立了基于月度累计沉降量时间序列的滚动预测模式,提出了“线性回归+BP神经网络”的组合预测模型。同时根据2013—2020年地铁沿线地面沉降的合成孔径雷达干涉测量(InSAR)监测成果,选取3个表征不同地面沉降演变特征的永久散射(PS)点作为研究对象,分析评价了多元线性回归、BP神经网络和“线性回归+BP神经网络”等3种模型的预测效果。结果表明,“线性回归+BP神经网络”的预测精度均最高,体现了组合预测模型的有效性和优越性,对提升地面沉降预测精度具有一定的参考价值。
引用:[ ]张金华.上海市地铁沿线地面沉降预测研究[J].测绘科学,2024,49(04):114-122.DOI:10.16251/j.cnki.1009-2307.2024.04.011.
引言
地面沉降是城市地铁等重要基础设施安全和可持续发展的重大隐患,《上海市城市总体规划(2017—2035年)》明确提出要确保地铁等城市生命线的安全运行。近年来,上海市地面沉降取得了较好的防治效果,年沉降量控制在7 mm以内[1-2],但是不均匀沉降特征显著,局部地区沉降量较大,对穿越其中的地铁等交通基础设施带来了直接的安全威胁,并伴随着城市建设活动的持续,地面沉降对地铁等重大基础设施的安全影响将长期存在[1,3]。地面沉降监测有助于及时了解掌握地铁沿线地面沉降的现状,预测则可以提前知悉地面沉降的发展趋势,为地面沉降风险预警和制定针对性的防治措施提供了技术支撑,也为地铁等重大基础设施安全提供了有力保障,因此开展地铁沿线的地面沉降监测和预测研究具有重要的现实意义。
近年来,星载合成孔径雷达干涉测量(interferometric synthetic aperture radar, InSAR)技术已经被成功应用到城市地面沉降的监测中[4-5]。随着SAR卫星分辨率的提高和InSAR技术的进步,在开展InSAR区域地面沉降监测研究的同时,进一步关注地铁等重大基础设施的沿线形变成为研究热点。将InSAR监测与沉降预测相结合,可以开展大范围、高效率的沉降监测和预测研究工作,有助于及时了解地面沉降现状和发展趋势,可为评价地面沉降风险,制定有针对性的防治措施,保障社会的可持续发展提供有力的技术支撑。
目前地面沉降预测方法按模型种类主要可以分为3类[6-8]:物理模型、数理统计模型和人工智能模型。物理模型主要是指基于太沙基有效应力原理和Biot固结理论建立的水土渗流模型[9-10],与地面沉降机理的研究密切相关。数理统计模型和人工智能模型统称为数学模型[10-11],与物理模型最大的差别在于不需要严谨的理论基础,甚至可以直接抛开地面沉降机理,纯粹采用数学方法进行预测。常用的数理统计模型有回归分析[12]、时间序列[13]、统计分析[14]和灰色模型[15]等;得益于人工智能的快速发展,人工智能模型的种类较多,常见的模型有人工神经网络[16]、遗传算法[17]、深度森林[18]、蚁群算法[19]、支持向量机[20]、机器学习[21]、长短时记忆网络[7,10]等。
从实际应用的角度来看,物理预测模型的优势是具有严谨的理论解译基础,但是模型假设条件造成的局限性和大量复杂水土地质特性参数的不易获取性,在一定程度上降低了物理模型的预测效率和实用性;数理统计模型是基于已知数学模型的构建,具有明确的表达式,比物理模型简单,预测效率高,但面对复杂的地面沉降情况时,模型预测准确率比较低,在实际预测中并没有得到大量的推广应用。人工智能模型因具有良好的非线性映射能力,可以高度拟合复杂的非线性关系,具有良好的预测效果,同时又不受先验知识的约束,因此被广泛应用于地面沉降预测领域[7-8,12]。值得一提的是,即使是人工智能模型,也会遇到预测精度提高有限的瓶颈,有必要进一步拓展思路,在深入研究各预测模型特点的基础上,构建组合模型预测方法,为突破精度瓶颈提供可能。
文献[22]中基于154幅高分辨率TerraSAR-X影像和时序永久散射体合成孔径雷达干涉测量(persistent scatter InSAR,PS-InSAR)技术,获取了2013—2020年间上海地铁沿线的地面沉降场,同时采用地铁沿线的水准点对InSAR的监测结果进行了对比验证,确认了InSAR监测结果的可靠有效,本文将在此基础上,选择代表性的永久散射(persistent scatter, PS)点开展地面沉降预测模型研究。
1 研究区与数据
1.1 研究区
上海是中国的直辖市之一,是长江三角洲世界级城市群的核心城市,位于东经120°52′E~122°12′E,北纬30°40′N~31°53′N之间,行政区划面积为6 340.5 km2,地处太平洋西岸,亚洲大陆东沿,长江三角洲前缘,长江和黄浦江入海汇合处;地势总体呈由东向西低微倾斜,除西南部有少数山丘外,均为坦荡低平的平原,起伏不大,地表平整系数接近1,是长江三角洲冲击平原的一部分[2,23]。
上海自1995年第一条地铁开通运营,目前已有地铁19条,车站超过500座,运营里程超过800 km, 运营里程世界第一,承担了超60%的城市公共交通运量[24],在上海城市规划和发展中具有重要地位。
本文的研究区主要为文献[22]搜集的TerraSAR-X影像所覆盖的区域,详见图1。

图1 研究区范围及对应的地铁线路位置
Fig.1 The Study Area in Shanghai and the Position of Metro Lines
1.2 数据
为凸显沉降预测的意义,特选择地铁沿线地面沉降较大的PS点作为研究对象,文献[22]中所列举的P2、P3、P6都是地铁沿线典型的沉降区域(见图2),并分别呈现了地面沉降的3种不同的时间演变特征。其中P2区域在2013—2017年一直存在基坑工程建设和建筑施工活动,期间该区域地面沉降约-23 mm; 随着2017年主体建筑施工基本完成,2017—2020年该区域的地面沉降明显放缓,地面沉降量一直维持在-15~-21 mm之间;P3区域在2013—2020年一直有大规模的基坑工程建设,地面也一直在持续下沉,沉降幅度达-32 mm, 同时发现地面沉降过程中呈现有规律的上下波动,可能是与地下水水位波动有关。考虑到2020年该区域的基坑施工还未完工,后续可能会继续下沉;P6区域没有大规模工程建设的情况,但驻有多家混凝土公司,长期堆放大量的混凝土等建筑材料,对该区域形成了长时间持续的超重荷载,2013—2020年间累计沉降量约-50 mm[22]。因此有必要对这些典型区域的地面沉降发展趋势进行重点关注,本文在P2、P3和P6区域中随机选择PS点(分别记为PS-P2、PS-P3、PS-P6)作为研究对象,开展地面沉降预测研究,并分析评价各种预测方法在不同沉降趋势下的预测效果。

图2 上海地铁沿线地面沉降速率图(2013—2020年)
Fig.2 The Land Subsidence Rate along the Subways in Shanghai from 2013 to 2020
由于气象条件、成像质量等问题,2013—2020年间部分TerraSAR-X影像缺失,导致地面沉降InSAR监测成果的时间序列间隔并不完全一致,考虑到TerraSAR-X影像拍摄的时间周期为11 d, 为尽可能利用已有的InSAR监测成果,这里以1个月为时间间隔,对原始的地面沉降时间序列成果进行重采样,构建以月度累积沉降量为元素的时间序列。
2 研究方法与技术路线
2.1 多元线性回归
两个或两个以上自变量对一个因变量的数量变化关系,称为多元线性回归分析,表现这一数量关系的数学公式,称为多元线性回归模型。多元线性回归模型是一元线性回归模型的扩展,其基本原理与一元线性回归模型类似,只是在计算上相对复杂。一般采用最小二乘法求取具体的模型参数。
2.2 BP神经网络
BP神经网络于1986年由美国学者Rumelbart和McClelland等人首次提出[25],是一种多层网络的BP(back propagation)算法——反向传播学习算法。一般采用3层就能够解决问题,即1个输入层、1个隐含层、1个输出层,参见图3。

图3 BP神经网络的模型结构图
Fig.3 The Structure Diagram of BP Neural Network
BP算法的主要思想是把学习过程分为两个阶段[26]:
第一阶段(正向传播过程):给出输入信息通过输入层经隐含层,利用激活函数计算出每个单元的实际输出值。第二阶段(反向传播过程):若在输出层未能得到期望的输出值,则逐层递归地计算实际输出与期望输出之差值(即误差),以便根据此差调节权值。本文的激活函数选取常用的标准Sigmoid型函数。
2.3 “线性回归+BP神经网络”
多元线性回归方法原理简单,计算方便,结果稳定,但是面对非线性、复杂的地面沉降趋势时,预测精度不高,数学模型误差较大。
BP神经网络对复杂非线性系统具有良好的适应分析能力,因此在一定程度上能减少数学模型误差,提高预测精度,但同时也存在数学原理复杂、计算时间长、结果不稳定等缺点。
为了充分发挥两种方法的优点,突破各自方法自身的局限性,本文构思利用BP神经网络对多元线性回归产生的模型误差进行补偿,尝试提出一种组合预测方法——“线性回归+神经网络”法,研究进一步提高预测效果的可能性。该方法的具体建模步骤如下:
1)将多元线性回归法得到的预测值SL,与实际值进行做差计算,获得预测误差ΔS。
2)将多元线性预测值SL与多元线性回归模型中的自变量一起添加进BP神经网络的输入层,输出层为多元线性的预测误差ΔS。经BP神经网络运算,获得ΔS的拟合值ΔSBP。
3)将多元线性预测值SL,加上BP神经网络输出的ΔSBP,就得到了新的预测值SBP+L=SL+ΔSBP。
2.4 预测模式
利用地面沉降监测值的时间序列构建预测模式是一种常用的方法[8-9,13,17-18],本研究建立的预测模式为采用前n期时间序列来预测第n+1期的累计沉降量,将最后6期(2020年4—9月)的月度累计沉降量作为检验样本,计算预测中误差。为确认建立预测模型所需的时间序列长度n,以地面沉降演变特征相对复杂的PS-P2点为例,在BP神经网络中依次将3~24期的时间序列作为输入层,分别计算拟合中误差和预测中误差,试验中将BP神经网络模型的隐含层设置为15,学习结束的条件设置为:学习拟合中误差的绝对值不大于2.0 mm。根据试验结果,当输入层依次是3~8期长度的时间序列时,迭代次数均超过1.6×105次,拟合计算时间均超过60 min, 且拟合中误差还无法满足学习结束要求,因此不予采纳。图4列举了输入层依次是9~24期长度的时间序列时,计算的拟合中误差和预测中误差。

图4 不同时间序列长度下的BP神经网络计算结果
Fig.4 The Calculation Results of BP Neural Network with Different Time Series Lengths
由图4可知,当输入层的时间序列长度设置为12期时,可以取得最好的预测效果:拟合中误差为±1.76 mm, 预测中误差为±1.85 mm, 且两者数值相近,说明所建立的模型具有较好的延伸预测效果。当输入层为其他时间序列长度时,虽然有的拟合中误差也较小,但是预测中误差却较大,也说明所建模型的适用性相对较差。因此本研究采用前12期时间序列来预测第13期的月度累计沉降值。
2.5 技术路线
根据重采样构建的时间序列,每个PS点共有90期(2013年4月—2020年9月)月度累积沉降值,预测的总体思路是将前84期(2013年4月—2020年3月)的时间序列用于构建预测模型,将得到的模型用来预测后6期(2020年4—9月)的月度累计沉降值。具体预测模式为,采用前12期时间序列预测第13期的月度累计沉降值,并依次向后进行滚动预测,据此共得到预测模式样本78组,其中前72组为学习样本,用于建立预测模型,后6组为检验样本,用于检验所建立模型的预测效果。据此研究思路形成的技术路线参见图5。

图5 技术路线图
Fig.5 The Technology Flow Chart of this Study
3 地面沉降预测
3.1 预测模型
3.1.1多元线性回归
基于前12期时间序列预测第13期月度累计沉降值的模式,具体线性回归预测模型见式(1)。
S= ∑ i=1 12 a i x i +a 0 (1)
式中:S为第13期的月度累计沉降值;ai为线性回归模型系数,xi为第i期的月度累计沉降量,i取值1~12。
然后在PS-P2、PS-P3、PS-P6等3个PS点上,分别利用各点前72组学习样本对回归模型的系数进行计算,计算得到3个点的线性回归模型系数。
3.1.2 BP神经网络
本案例中,选择3层BP网络结构,分别为输入层、隐含层和输出层。激活函数采用标准的Sigmoid函数。其中输入层为月度累计沉降值前12期的时间序列,输出层为第13期的月度累计沉降值,隐含层节点数为15。
3.1.3 “线性回归+BP神经网络”
选择3层BP网络结构,分别为输入层、隐含层和输出层。激活函数采用标准的Sigmoid函数。其中输入层为月度累计沉降值前12期的时间序列和线性回归的预测值,输出层为线性回归预测误差(即预测值与实测值的差值),隐含层节点数为15。
3.2 预测精度
对预测结果的评价,本文采用测量学上的中误差(均方根差)作为精度评价指标。
3.3 预测结果
根据构建的PS-P2、PS-P3、PS-P6月度累计沉降量时间序列样本和3种预测模型,分别绘制了拟合和预测曲线(见图5,图6和图7),并计算了对应的预测中误差(见表3)。
据表3可知,在这3个预测案例中,多元线性回归的预测效果均最差,BP神经网络较好,“线性回归+BP神经网络”均最好。相比线性回归的预测结果,“线性回归+BP神经网络”的预测中误差最高降低了46.3%(PS-P6);相比BP神经网络预测结果,“线性回归+BP神经网络”预测中误差最高降低了29.2%(PS-P3);体现了“线性回归+BP神经网络”预测模型的优越性和稳定性。
为进一步剖析3种预测模型的特点,本文对每个预测案例的预测结果进行了分析评价。

图6 3种模型的拟合和预测曲线(PS-P2)
Fig.6 Fitting and Prediction Curves of Three Models(PS-P2)
由图6可知,在拟合区,线性回归预测曲线与实测值吻合度较高(拟合中误差为±0.71 mm),但在预测区预测结果较差(预测中误差为±1.18 mm),主要是因为大部分拟合区段的线性特征比较明显,有利于线性回归优势的发挥,而预测区的地表变形趋势与拟合区存在较大差异,主要表现在最后3个时间点(2020年7月—2020年9月)的沉降量趋势发生改变,非线性特征明显,因此预测效果较差;BP神经网络拟合效果要比线性回归要差(拟合中误差为±1.18 mm),但在预测区,预测效果则较好(预测中误差为±1.07 mm)。主要是因为BP神经网络追求的是整体最优,不会出现过分贴合其中一段,而忽略其他部分的情况,这在一定程度上决定了BP神经网络的外延预测性能要比线性回归好,同时其善于处理非线性的特点也会比线性回归更好地适应预测区地表变形非线性变化的特点。“线性回归+BP神经网络”组合的拟合效果在3种方法中,处于中间等级(拟合中误差为±0.85 mm),在预测区的效果则最好(预测中误差为±0.97 mm),说明组合模型在一定程度上综合了两种方法的优势,突破了原有单一方法自身的局限性,从而提升了预测精度。

图7 3种模型的拟合和预测曲线(PS-P3)
Fig.7 Fitting and Prediction Curves of Three Models(PS-P3)
由图7可知,PS-P3的地面沉降趋势特征与PS-P2明显不同,主要表现在线性变化区段较少,总体上呈波浪式非线性特征,因此线性回归方法的拟合效果(拟合中误差为±1.71 mm)和预测效果(预测中误差为±1.95 mm)均较差;BP神经网络并没有取得比线性回归好太多的结果(拟合中误差为±1.76 mm; 预测中误差为±1.85 mm),主要的原因可能是此沉降曲线变化比较复杂,受限于样本数据有限,BP神经网络非线性的处理能力也无法得到充分体现。“线性回归+BP神经网络”组合预测精度则得到了进一步提升(拟合中误差为±1.63 mm; 预测中误差为±1.31 mm),说明该组合模型的适用范围较广,稳定性较好。

图8 3种模型的拟合和预测曲线(PS-P6)
Fig.8 Fitting and Prediction Curves of Three Models(PS-P6)
由图8可知,PS-P6沉降曲线在整体上以线性特征为主,只在首尾两端表现为非线性特征,因此线性回归的拟合效果较好(拟合中误差为±1.10 mm),但预测误差则明显大了很多(预测中误差为±3.48 mm),再次说明线性回归方法外延预测能力较差;BP神经网络因追求整体最优,所以拟合效果和预测效果虽然不是很高,但是比较稳定(拟合中误差为±2.22 mm; 预测中误差为±2.48 mm);“线性回归+BP神经网络”组合预测精度再次得到了提升(拟合中误差为±0.55 mm; 预测中误差为±1.87 mm),再次说明该组合模型的设计思路科学有效,相对单一的预测模型,该组合有一定的优越性。
综上所述,3种模型均能较好地预测不同沉降特征的时间序列,并表现出自身的适用特点。其中线性回归处理线性问题能力较强,对学习样本的依赖性较强,表现为非线性处理和延伸预测能力较弱,在具体预测实践中,往往出现拟合精度较高,但预测精度不理想的情况。BP神经网络因追求整体最优,在一定程度上影响了拟合精度,但是预测效果较好,且和拟合精度一致性较高的特点说明了BP神经网络的稳定性和较强的延伸预测能力。“线性回归+BP神经网络”组合可以进一步发挥两种单一模型的优点,做到优势互补,处理问题的能力得到加强,预测效果提升明显,实现了模型设计的预期效果,体现了组合模型的优越性。
4 结束语
本文基于2013—2020年地铁沿线地面沉降的InSAR监测成果,选取3种不同时间演变特征的地面沉降时间序列为预测对象,研究分析了多元线性回归、BP神经网络和“线性回归+BP神经网络”等3种方法的预测能力,获得了以下的结论:
1)对典型PS点的InSAR监测成果进行重采样,生成了以月度累计沉降量为要素的时间序列,并构建了以前12期的时间序列来预测第13期月度累计沉降量的滚动预测模式。
2)3种方法在3个典型案例上的预测结果表明,本文提出的“线性回归+BP神经网络”方法预测效果均表现最好,预测中误差最小,相对线性回归预测结果,最大提高了46.3%,相对BP神经网络预测结果,最大提高了29.2%,体现了组合方法较好的稳定性和适用性。说明通过对多种方法进行科学的融合集成,可以实现取长补短,突破单一方法局限性,从而达到预测效果提升的目标。
3)本文只是尝试了一种预测组合模型,相比组合本身呈现的优越性,更重要的意义在于提供了一种提高预测精度的思路,建议在深入了解各种单一预测模型原理和特点的基础上,尝试其他的组合预测模型,以达到进一步提高预测精度的目的。

