大数跨境
0
0

Nature Computational Science : 通过人类流动性视角看城市动态

Nature Computational Science : 通过人类流动性视角看城市动态 大数据透视地理
2024-12-11
0

Xu, Y., Olmos, L.E., Mateo, D. et al. Urban dynamics through the lens of human mobility. Nat Comput Sci 3, 611–620 (2023).

摘要

城市空间结构代表了城市中公共和私人空间的分布以及人们在其中的移动方式。尽管城市空间结构通常演变缓慢,但在大规模紧急事件期间或快速发展国家的城市更新过程中,它也可能发生快速变化。本文提出了一种通过人类流动性指标“流动中心性指数” (ΔKS) 在准实时中描绘此类城市动态的方法。作为案例研究,我们追踪了 COVID-19 疫情期间西班牙十一座城市的城市动态。研究结果显示,在第一波疫情封锁期间,这些城市的空间结构变得更加单中心化,但在第二波疫情中保持了其常规的空间结构。为了更全面地理解居家流动,我们还引入了一个无量纲指标 KSHBT,用于衡量基于居家的出行程度,并为 COVID-19 的传播提供统计洞察。通过利用个体流动性数据,我们的指标能够有效检测城市空间结构的变化。

引言

研究背景:城市化是近年来人类历史中最重要的变化之一,极大地改变了人们的生活、工作和出行方式。然而,快速的城市扩张也可能威胁到社会经济和环境福祉,对宜居性造成不利影响。例如,经济增长和创新产出的规模通常与城市规模密切相关,但城市扩张也会带来负面效应,如加剧区域空气污染和城市热岛效应。在城市化过程中,城市结构影响着居民点的环境和能源成本,并限制城市在既定空间内的发展,包括交通规划和劳动力市场的扩展。基于此,城市设计师通常以长期可持续目标为导向,试图对城市结构进行调控。

研究空白:由于人口、资源和城市管理之间的复杂互动,使得所需信息的收集非常繁琐,城市空间结构的演化——即城市动态——通常只能缓慢监测。在城市规划中,城市结构通常由两个互补的要素定义:(1) 人口的空间分布和 (2) 功能设施或工作场所的空间分布。在缺乏流动性数据的情况下,研究人员通常使用就业或通勤流动的普查数据作为出行吸引力的代理。然而,国家或州一级的出行调查通常无法提供最新信息,未能考虑到大规模紧急事件(如疫情、自然灾害或社会经济危机)的发生。这些事件可能导致人口迁移和流动模式的改变,并重新塑造城市结构。因此,有必要以准实时的方式识别城市动态,以便促进及时的政策响应和更有效的规划。过去十年中,通过居民流动性数据的广泛收集,为城市规划提供了强大的工具。数据驱动的方案能够揭示人类与复杂城市系统之间的动态交互。

研究概述:本文研究了多个城市,并探索了利用人类流动性定义城市空间结构的潜力。研究发现,居住地与中央商务区(CBD)的相对位置是决定流动性规模的关键因素。基于这一发现,我们提出了一种流动中心性指数 ΔKS,该指数是旅行者群体与 CBD 距离的函数。ΔKS 量化了人们以家庭为中心的旋转半径 Rg 随城市中心距离的变化程度。通过 Kolmogorov–Smirnov(KS)检验测量不同人群 Rg 值的统计差异。我们分析了来自美洲、亚洲和欧洲的 21 座城市,发现这一与尺度无关的指标能够评估范围广泛的城市结构,从单中心到多中心形式。具体而言,较大的 ΔKS 表明城市结构更单中心化,说明即使居住在外围的人群也经常前往 CBD。相反,更均匀的 Rg 分布表明城市更趋向多中心化,表明多个商业中心已形成。本文利用来自 2019 年和 2020 年 1700 万匿名用户的手机数据,揭示了疫情对不同收入群体流动行为的不平等影响。

结果

从种族和经济地位的角度分析城市空间

空间隔离限制了人们获取教育、就业和公共设施的机会,加剧了收入差距,甚至影响健康状况。通过分析流动性数据,我们发现,无论城市结构如何,社会经济隔离普遍存在。图 1a 展示了波士顿、洛杉矶和波哥大三座城市的种族、收入和社会经济阶层(SES)分布情况。波士顿和洛杉矶的高收入群体通常居住在城市外围,而低收入群体集中在市中心。波哥大的模式则不同,高收入群体(SES 5 和 6)集中在北部,而低收入群体(SES 1 和 2)主要分布在外围(补充图 3)。通过定义信息理论隔离指数 ,我们发现白天的空间隔离显著低于夜晚(补充部分 3 和补充图 4a),显示居住地是隔离的主要影响因素。此外,分析非工作活动发现,波士顿和洛杉矶的大部分访问者与目的地的种族群体一致(补充图 4b–d),波哥大在 SES 方面也表现出相似模式。这表明,休闲活动的社会经济隔离反映了流动选择中的同质倾向。

图 1 | 社会经济隔离及其与旋转半径的关系 a, 波士顿、洛杉矶和波哥大居民社会经济地位的空间隔离分布图,白色五角星表示 CBD 位置。B–d, 波士顿 (b)、洛杉矶 (c) 和波哥大 (d) 不同社会经济群体的  分布,波士顿、洛杉矶和波哥大的样本量分别为 258 万、329 万和 414 万。E, 西班牙 2019 年和 2020 年(疫情前后)年收入与人群平均  的关系,数据来自 1700 万匿名手机用户。

空间隔离对流动行为产生了显著影响,尤其是由于外围地区缺乏就业机会和设施。图 1b–d 展示了波士顿、洛杉矶和波哥大不同社会经济群体的旋转半径( )分布,反映了居民日常流动范围。波士顿和洛杉矶的高收入居民往往出行距离更长,而波哥大则无明显规律。这表明,不同城市中  的分布与社会经济特征之间并无统一模式。疫情期间,各国实施的旅行限制导致流动性下降和失业率上升,不同社会经济群体对此的反应存在显著差异。图 1e 显示了 2019 年和 2020 年西班牙 1700 万匿名手机用户年收入与日均  的关系。2019 年 4 月,高收入居民的长途旅行在 2020 年同期基本消失。此外,疫情早期和第二波高峰期(2020 年 10–12 月),高收入群体的流动性下降幅度更大,而低收入群体因必要任务出行更多,难以居家工作。疫情期间,高收入人群的长途旅行显著减少,反映了经济地位对流动性的显著影响。

提出的流动性指标

人类在复杂的城市系统中出行是为了工作、获取资源或参与社交活动,这些活动通常以居住地为中心。同时,城市的组织形式可以抽象为单中心到多中心的光谱(图 2b)。在单中心城市,居住地靠近 CBD 的居民可以更便利地获取资源,因此出行距离通常较短,而外围居民的出行距离更长。相比之下,在多中心城市,次中心能够提供资源,人们不必依赖于 CBD。这一趋势在多个城市的流动数据中得到了验证。我们采用同心环的概念,以 CBD 为中心划分等宽环状区域,将居民按照居住地分组(图 2c)。分析表明,在某些城市中,居民旋转半径( )与环半径呈线性关系,但其他城市则并非如此(补充图 7)。这些结果表明,尽管城市组织形式各异,但一般而言,居住地距离 CBD 越远的居民往往进行更长距离的出行。然而,单纯将  视为 CBD 距离的函数不足以全面刻画城市空间结构

**图 2 | 汇总指标与人类流动和城市结构的关系示意图** a, 描述  的图示,显示个体在研究期间访问位置的空间覆盖范围。b, 单中心城市(左)与多中心城市(右)典型流动行为的示意图,单中心城市中人们通常前往CBD获取资源,而多中心城市中的流动目的地更分散。c, 波士顿的分级填色图示,显示以CBD为中心的同心环(环宽  为3公里,适用于所有城市)。d, 定义 KS(ri∣r0) 指标,用于量化外围环 ri 和 CBD 圈 r0 居民  分布的差异。e, 定义流动中心性指数 ,表示居民  随CBD距离变化的空间差异。f, 定义居家出行指标 ,表示实际  分布与居家限制条件下假设  分布之间的 KS 差异。

为了更准确地描述城市结构,我们引入了流动中心性(mobility centrality)概念,通过Kolmogorov-Smirnov(KS)统计量衡量中心环与其他环居民 分布的差异,并定义其斜率为流动中心性指数 。这一指标能够在不同尺度上评估城市从单中心到多中心的空间结构。COVID-19疫情早期,作为病毒传播的主要推动力,人类流动性受到了研究者和政策制定者的广泛关注。研究通常利用总流量或平均位移距离衡量居家令的效果,但这些指标可能掩盖了流动行为的分布差异。此外,流量和距离显著依赖城市的人口规模,限制了跨区域的流动性比较。为了解决这一问题,我们提出了居家出行指标(KSHBT),用于量化居家令的执行效果。KSHBT是实际观测到的居民 分布(包括 )与假设所有人完全居家的 分布之间的KS距离。假设情况下, 服从0到预定义阈值 之间的均匀分布, 表示居家令下的流动半径。如图2f所示,KSHBT可以解释为 超过 的人口比例。较低的KSHBT意味着更多人居家或在家附近活动,有助于评估出行限制政策的执行程度及其对流动性的影响。

通过个体流动指标研究城市动态

图 3a 展示了城市空间结构的二维空间,分别量化了人口分布的紧凑性和功能单元的中心性。人口数据基于 LandScan 数据集,以约 1 平方公里的街区为单位,所有研究城市的可视化见补充图 2。图 3b 分析了深圳、武汉、洛杉矶和波士顿四座城市中,每个宽度为 3 公里的环状区域内  的分布。结果显示,武汉和波士顿的  随距离 CBD 增加而向更大值偏移,表明两者为单中心城市,出行集中于 CBD 附近。相比之下,深圳和洛杉矶的  分布与距离 CBD 关系不显著,显示出多中心特征。深圳人口分布紧凑,集中于 CBD 环内,而洛杉矶则更均匀分布于全市范围。这表明,  的统计差异能够补充人口分布信息,反映城市多中心性的程度。图 3c 展示了 21 座城市的  分布,分析排除了当天未移动的用户( )。当  值随距离变化保持稳定时,表明不同区域居民的日常流动行为相似。通过流动中心性指数  捕捉  的空间变化,并用  表示长期观测的典型值。拟合结果(补充图 12)显示,大多数城市的  值较高,旧金山湾区因不规则的空间拓扑结构表现较差。

**图 3 | 通过人口流动行为定义城市结构** a, 城市空间结构的两个维度:中心性(从多中心到单中心)反映人口中心的数量,集中性(从分散到紧凑)表示人口在CBD外分布的异质性或分散程度,部分样本城市的人口分布以三维柱状图可视化。b, 深圳、武汉、洛杉矶和波士顿七个环区域内  的分布(环宽 3 公里),插图显示每个环的人口数量,四座城市七个环的人口总数分别为 86.9 万、60.2 万、174.7 万和 126.7 万。c, 外围环的流动性分布变化  与其相对CBD半径的关系。d, 基于  和人口 Gini 指数的二维空间中各城市的分布,误差条显示  计算的线性拟合标准误差,图例中的城市按  降序排列。

通过 Gini 指数衡量城市人口分布的均匀性,发现  随 Gini 指数增加略微上升(图 3d),表明紧凑型城市更倾向单中心化。例如,武汉人口分布最紧凑,其  仅次于圣克鲁斯,而波尔图等城市尽管  相近,却表现出更分散的人口分布,可能处于城市蔓延的阶段。深圳则作为多中心城市,人口与资源分布均匀,而旧金山湾区和洛杉矶的多中心性则伴随着更分散的人口分布。在分析中,环宽固定为 3 公里,并测试了其他宽度(1 公里和 2 公里)的影响。结果表明,尽管 3 公里环宽的拟合表现稍优,但环宽的变化对研究结论无实质性影响(补充图 14)。

在危机时期感知城市动态

2020 年 2 月,西班牙各城市开始受到疫情冲击,政府于 3 月 14 日实施全国范围的封锁措施。图 4a 显示了 2020 年 9 月 30 日之前每千人感染率的时间序列,并将研究分为三个阶段:第一波疫情(4 月 30 日之前)、平静期(5 月 1 日至 6 月 30 日)以及第二波疫情(7 月 1 日之后)。基于 2020 年 2 月至 9 月间的手机数据,我们分析了 11 座西班牙城市的流动行为及城市动态变化。封锁期间,中位  接近 0.5 公里,因此在  的定义中将  设定为 0.5 公里。对个体  值进行处理后,计算了每日的  和 ,并对指标进行七天平均以减少周期性波动(补充图 17、18)。图 4b–d 展示了各指标相较于 2020 年 2 月第一周的相对变化。强制封锁期间,三项指标均发生显著变化,显示各城市在封锁后变得更加单中心化(  上升)。例如,巴塞罗那、塞维利亚和马德里等多中心城市在封锁期间表现出明显的单中心化转变。到 6 月旅行限制解除后,大多数城市结构恢复至正常水平,而阿利坎特则表现出更强的多中心化,可能与第二住宅业主的迁移有关。图 4c 显示,2 月末感染人数增加时,某些城市(如塞维利亚和马拉加)出现了  的显著波动,反映人们为应对未来封锁而进行的长距离出行。图 4d 则表明,  的恢复早于 ,且在整个研究期间表现更稳定,突显其作为衡量流动限制指标的可靠性。

**图 4 | COVID-19 疫情期间西班牙 11 座城市的城市空间结构和流动行为变化** a, 每千人每日感染率(截至2020年9月30日),全国封锁于3月14日开始,用虚线标示,研究期分为第一波疫情(4月30日之前)、平静期(5月1日至6月30日)和第二波疫情(7月1日之后)。b, 流动中心性指数  相较2020年2月第一周的相对变化。c, 以  衡量的流动规模的相对变化。d, 居家出行指标  的相对变化。e–g, 不同阶段(I、II、III)流动行为对有效再生产数  的影响,散点图显示每日和每座城市中各因素对  的影响,插图通过绝对 SHAP 值均值与该阶段  平均值的比率表示各因素的相对重要性。

为探讨城市动态和流动行为对 COVID-19 传播的影响,我们利用 EpiEstim 包估算有效再生产数 。研究显示,  在封锁后一周降至 1.0 以下,但在 6 月出现波动,预示第二波疫情到来。随后,通过梯度提升机器(GBM)模型分析  与流动性及城市变量的关系,并用 SHAP 值评估各变量的影响(图 4e–g)。在第一阶段(图 4e),流动性变量(  和 )对  的正向影响最为显著,尤其是 。这表明频繁且长距离的流动加速了疫情传播。第二阶段(图 4f)中,  的影响仍然显著,但  的作用减弱,而  的权重有所增加。第三阶段(图 4g)显示,所有变量的重要性下降,因非流动性防控措施成为主要干预手段。总体而言,疫情期间的流动性变化直接影响城市动态与传播风险,尤其是封锁期间的单中心化和流动性范围的限制在控制疫情传播中发挥了重要作用。

讨论

本文旨在通过研究人们如何在空间中与资源互动,来理解城市动态。我们在计算提出的流动性指标时使用了个体轨迹的旋转半径( )。然而,为了解决隐私问题,大多数智能手机平台正转向匿名化的聚合数据收集(如 k-匿名性等)。在此背景下,尽管  仅反映单个用户的流动范围,而不包含任何私人信息,但其计算仍需使用每位用户的个体轨迹。因此,在实现 k-匿名性的情况下,无法直接计算 (见图 2a)。为了解决这一问题,可能需要采用专门设计的 k-匿名性策略,或者让移动运营商直接从智能手机中收集  值,而不是用户的完整移动轨迹。本研究为未来的研究提供了若干有前景的方向。虽然我们观察到在 COVID-19 疫情初期,低收入人群的出行距离长于高收入人群,但这些出行的目的尚不明确。这一知识空白限制了我们对封锁措施不平等影响的理解。为了解决这一问题,未来的研究可以利用长期的流动轨迹数据识别关键岗位工作人员,并探讨他们在紧急事件中的行为,重点关注社会经济公平性。总体而言,我们的研究强调了精细化个体流动数据在量化城市动态中的重要价值。在疫情或自然灾害等大规模紧急事件中,准实时感知城市动态对于更好地规划城市的重新开放或重建尤为重要。

方法

城市边界选择
城市边界的选择影响人口分布的空间中心性及城市空间结构指标的计算。本研究使用各城市的都市区范围。对于美国和葡萄牙的大城市,采用普查数据中的都市复合区边界,包括多个相连的城市和城镇;对于西班牙城市,选择 AUDES 项目定义的城市区域;中国和拉丁美洲的城市则采用行政边界。CBD 的位置通过 Google Maps 选取,并定义为半径 3 公里的圆形区域,其地理坐标无需非常精确。21 座城市的边界、面积及 CBD 位置以相同比例尺展示于补充图 1,边界 shapefiles 可在 [GitHub]获取。

人口与社会经济数据
本研究使用 LandScan 提供的 2015 年街区级人口数据(~1 公里分辨率)。选择人口超过 500 的街区计算 Gini 指数,21 座城市的人口分布三维柱状图、总人口和 Gini 指数见补充图 2。
美国城市按家庭收入中位数是否低于 4.52 万美元的中产门槛划分为低收入和高收入群体;按种族比例(50% 阈值)划分为非西班牙裔白人、非西班牙裔黑人、西班牙裔及亚裔。在波哥大,使用城市规划部门的社会经济分层(SES,1-6 级,代表从最低到最高收入)作为收入水平的代理。

流动性数据
在亚特兰大和里约热内卢,基于出行调查数据获取居住地和日常访问地(样本量分别为 567,301 和 444,127)。其他城市使用手机数据,通过移动基站的交互记录匿名用户的地理位置。CDR(通话详细记录)数据记录了通话和短信活动,分辨率从密集地区的 50 米到稀疏地区的 300 米不等。中国和西班牙城市使用 XDR(扩展详细记录),记录更频繁,包含数据使用活动,适于捕捉流动行为。对于 CDR 数据(如波士顿、旧金山湾区、洛杉矶等),采用 TimeGeo 框架建模用户流动行为,通过普查数据的扩展因子模拟整个城市的人口流动。居住地通过周末和工作日夜间最频繁访问位置确定。

手机数据观测期
手机数据的观测期为一个月到六个月不等。例如,洛杉矶和旧金山湾区为2012年10-11月,波士顿为2010年2-3月,波哥大为2013-2014年,深圳为2013年10月,武汉为2012年8-9月,里斯本和波尔图为2006-2007年。西班牙城市数据涵盖 2019 年 10 月和 2020 年 2 月至 9 月,用于分别研究疫情前的典型流动行为及疫情期间的流动与传播影响。

有效再生产数  的估算
使用 EpiEstim R 包估算 SARS-CoV-2 的传播强度 。假设  的先验概率为均值 2.6、标准差 2.0 的 Gamma 分布;生成时间分布为均值 3.6 天、标准差 4.9 天的离散 Gamma 分布。计算  时,采用时间窗口为7天的数据,估算结果见补充图 19。

使用 SHAP 评估特征重要性
通过 SHAP 包评估流动性和城市动态变量对  的影响。使用 LightGBM 实现 GBM 模型,输入包括时间变化变量(  和 )及常量变量(  均值、 、总人口对数值、Gini 指数)。通过 SHAP 值量化每个变量对  预测的贡献,点图展示每个变量的影响方向和重要性(图 4e–g 插图展示各变量相对重要性)。例如,第一阶段中  的高值对应  的高值,表明其正相关性。


【声明】内容源于网络
0
0
大数据透视地理
精选地理科学领域的优质文章,专注于解读多源空间大数据如何助力地理科学相关问题
内容 102
粉丝 0
大数据透视地理 精选地理科学领域的优质文章,专注于解读多源空间大数据如何助力地理科学相关问题
总阅读8
粉丝0
内容102