大数跨境

基于大数据的城市活力区和中心城区边界识别|以广州市为例

基于大数据的城市活力区和中心城区边界识别|以广州市为例 广交研
2020-07-15
1
导读:本文讲述通过手机信令数据、互联网位置数据、兴趣点等多源数据,从人口综合密度、兴趣点密度两大静态指标,以及城市中心可达性、商务休闲活动驻点密度两大动态指标综合识别城市活力区和中心城区边界。

本文已于《城市交通》线上出版


摘要


城市活力区和中心城区是认识和研究城市的重要基础性信息,也是城市管控政策制定的前提。传统调查数据难以准确界定边界,活力区和中心城区边界的确定多以定性为主。大数据的兴起为城市功能区边界识别创造了条件。基于手机信令数据、互联网位置数据、兴趣点等多源数据,从人口综合密度、兴趣点密度两大静态指标,以及城市中心可达性、商务休闲活动驻点密度两大动态指标综合识别城市活力区和中心城区边界。动态指标和静态指标的组合使用克服单一指标或仅静态指标识别的局限性。以广州市为例阐述了该方法的实用性,并识别出广州活力区和中心城区的范围已与国际一流城市相当。

1.国内研究综述

城市空间结构是城市要素在空间范围内的分布和组合状态,是城市经济结构、社会结构的空间投影,是城市社会经济存在和发展的空间形式。文献[1]将中国空间结构研究分为三阶段:西方理论引入及中国实证研究起步期,中国实证研究积累期,以及目前正步入的对中国城市空间结构模式的总结及新城市空间现象研究的多元化时期。文献[2]对都市空间界定的四要素(空间要素、时间要素、流量要素和引力要素)进行了具体量化分析,用经济势能及交通权数来确定都市圈的空间范围,通过对四个要素的综合,确定了都市圈圈域半径和圈层结构的界定方法,并以成都都市圈为例做了实证分析,得出成都都市圈的圈域半径和圈层结构。文献[3]对兰州都市圈空间界定时,将经济距离、各周边城市的生活质量引入场强和引力模型的计算中,使界定方法更具借鉴性。文献[4]以百度兴趣点(Point of Interest, POI)数据为基础数据,提出一种基于大数据技术的城市空间结构的识别方法。文献[5]以重庆市主城区40余万条POI数据为基础,利用核密度分析、自然断点法和邻近分析等方法,根据整体及不同类型POI数据的空间分布特征与聚集程度,识别城市总体及不同职能的多中心结构及其影响范围。文献[6]以辽宁省盘锦市为例,使用POI数据,结合核密度分析法分析城市中各类设施分布的空间规律,并识别城市的空间布局。文献[7]以上海市主城区为例,借助百度地图的海量时空数据,着眼于服务可及性和要素建成情况,引入可达性格局分析、等时圈分析和基于POI分类的统计分析,从服务范围、服务时效和服务能力3个维度定量考察多中心空间发展特征,探索了多中心城市空间发展评估的新方法。

综上,目前国内关于城市空间识别研究采取指标较为单一,部分采取多指标识别研究也仅注重静态指标,缺乏动态指标的体现。单一指标缺陷是只能反映某一方面特征而忽视其他方面因素,然而城市空间结构形成是多种因素的综合作用,单一指标并不能完全真实地反映城市空间形态;全部采用静态指标不能体现城市流动性对空间形态的影响。

2.城市发展边界识别考虑因素及指标识别

城市活力区是一座城市政治、经济、文化等公共活动最集中的地区,是城市公共活动体系的主要部分,为城市和城市所在区域集中提供经济、政治、文化等活动设施和服务空间,并在空间上有别于城市其他地区。中心城区是一个城市现状发展最为成熟的地区,以多职能综合性为主,汇聚了城市生产和服务的主要区域,是政治和行政管理中心、交通运输中心、信息与科技中心以及人才密集之地。

活力区是城市功能高度聚集的区域,中心城区是城市发展成熟的区域,是城市交通网络最发达、出行活动最密集的地区。边界识别不仅要考虑静态指标影响还需考虑动态指标影响。为此,本文构建了2个静态指标和2个动态指标的综合识别体系:静态指标包括人口综合密度和POI密度,分别表征人口聚集和基础设施完善程度;动态指标为与城市中心可达性、商务休闲活动驻点密度,体现既有交通系统下区域交通联系的便捷程度和客流吸引强度。

  • 人口综合密度

人口综合密度不同于居住人口密度,综合密度反应的是该区域单位面积常态化出现的人口规模,是居住人口和就业人员的综合密度(扣除职住平衡人口),反应了居住和就业的完善程度。一般而言,人口综合密度越高的地区,是城市发展越成熟的地区。

  • POI密度

POI包括医院、学校、餐饮、酒店、超市商场、主要办公楼、主要交通枢纽、公园、加油站、银行、休闲娱乐设施、政府机构等城市生活服务的基本场所,反应了某一区域基础服务设施的分布密度,从一定程度上体现出区域的发展成熟度。

  • 与城市中心可达性

城市中心可用市政府所在地(或标志性地点)作为代表,其可达性反映了通过交通系统某一地区到达城市中心的便捷程度。可达性越高代表该地区交通系统越发达,越能反映该地区的发展状况。

  • 商务休闲活动驻点密度

商务休闲活动驻点密度不仅体现了某一地区常态化活动人口的出行强度,也反应了访问人员的出行强度,是该区域客流总体吸引强度,体现了交通流在城市成熟区的聚集程度和城市成熟区最重要的经济、政治、文化活动的成熟度。某一地区人口综合密度非常大,如某工业区大量工人会产生较高的人口综合密度,但其商务休闲驻点密度较低,并不能代表该区域是城市最为成熟的活力区域。

3.城市发展边界识别方法研究


3.1基于大数据的指标获取

21世纪前10年,四大指标的准确获取难度较大。人口综合密度可利用统计数据获取,但大城市特别是特大城市常住人口和从业人员大统计指标一方面不能最真实体现实际人口数,另一方面数据颗粒度较粗(最小颗粒度为居委会级),达不到城市发展边界识别的数据细颗粒度要求;POI密度在大数据兴起之前更是无法获取;到城市中心可达性虽然可借助交通模型技术获取,但模型计算值精度难以保证;商务休闲驻点密度传统方法无法获得。近年来,城市大数据的兴起为上述指标的获取提供了有效途径,数据的精细度能很好支撑城市发展边界的识别工作。各指标的获取方法如下。


1) 人口综合密度:须借助信息数据获取,如长周期的手机信令数据,通过一定算法可获取精确的城市职住空间分布,进而得到某一区域的人口综合密度,相关算法如下图所示。

图1:基于手机信令数据的职住地判别流程

2) POI密度:主要通过获取百度兴趣点数据并分区域进行统计。

3) 与城市中心可达性:该指标更能体现某一区域与城市中心的联系紧密程度,数据获取的精确性对城市发展空间识别至关重要。基于互联网位置数据是可达性获取的理想途径,如高德导航数据、腾讯导航数据等,通过利用互联网位置数据可获取细颗粒度小区间的实际耗时矩阵,从而能准确识别出某一点与任意区域的出行时耗。基于互联网的耗时矩阵精度高,从时间维度上体现了出行者的实际耗时,并非交通模型计算的某一时刻道路网分配结果。一般而言,与城市中心的时耗越小,可达性越强,区域发展越成熟。

4) 商务休闲活动驻点密度:该指标必须结合手机信令数据获取,通过信令数据获得驻点分布,进而获取驻点密度。与传统驻点算法不同,研究采取了基于高频率信号触发、具有时空间关联特征的用户信令数据和用户上网数据,通过对手机数据的职住对应关系(Live-Work)和时空间核聚类Clus分析,提出一种满足用户出行特征的驻点判断方法,具体流程如图2所示。

图2:基于手机信令数据的驻点判别流程


3.2综合指标的计算

四个指标从不同层面反应某一区域的开发成熟度,因此需采用一定权重对四个指标进行加权,以获取体现多种因素的综合指标,进而用于城市发展边界识别。采用专家打分法确定指标权重,通过调查20位城市规划领域相关专家,四个指标最终权重分别为0.22,0.18,0.33,0.27。

确定指标权重后,为使各指标能在同一维度进行加权,还需进行指标的归一化处理。采取阈值对各指标进行归一化处理,阈值计算方法为:将某一城市划分为若干个交通分区(颗粒度越细越好,一般特大城市应达到3 000个以上,大城市应达到1 500个左右),计算某一指标值,然后从高到底排序绘制分布曲线,采取80%分位值作为该指标的阈值,则某一区域的该指标归一化值为指标计算值与阈值的比值。

在归一化值的计算过程,人口密度、POI密度、商务休闲活动驻点密度均为正影响值,与城市中心可达性值为负影响,应采取倒数进行归一化处理。


3.3 基于核密度法的城市发展边界识别

近年来,核密度分析法在城市热点探索方面应用广泛。该方法应用与计算空间点、线要素在周围领域中的密度,并对密度分布进行连续化的模拟,以图像中每个栅格的核密度值反应空间要素的分布特征。研究根据每个交通分区内综合指标的核密度值估计其周围密度,并通过对不同搜索半径下的核密度分析结果进行比较,从而选取适合本研究的最优搜索半径。研究基于综合指标,利用核密度法将各小区的综合指标删格化处理,拟合为光滑锥状表面,进行城市发展边界识别。

4.广州市现状发展空间识别


4.1 四大指标的获取及阈值选择

数据源。在广州市活力区和中心城区边界识别中,主要利用联通手机信令数据、腾讯位置数据、百度POI数据,各数据主要用途如表1所示,POI数量如表2所示。

表1 各指标具体获取方法

表2 广州市POI类型分布

各交通小区指标计算。基于各类信息数据,获取广州市3 989个交通分区的四大指标,各指标的空间分布如下图所示。

人口综合密度

POI密度

与城市中心可达性

商务休闲活动驻点密度

图3 四大指标的空间分布

指标阈值的确定及归一化处理。将四大指标的各分区值按从小到排序后取80%分位值为该指标阈值(见图4)。其中人口综合密度阈值为2.5万人每平方公里,POI密度阈值为350个每平方公里,与城市中心可达性阈值为62 min,商务休闲活动驻点密度阈值为4.5万个每平方公里。归一化处理后并按权重系数0.22,0.18,0.33,0.27加权后得到各交通小区的综合指标如图5所示。

图4 四大指标分布排序曲线

图5 综合指标空间分布


4.2 广州市活力区和中心城区边界识别

进行核密度算法识别,得到结果如图6所示。根据计算结果并适当考虑城市现状路网分割,划定广州活力区的范围为93 km2,中心城区边界约600 km2,据此指导城市交通政策制定、先行试验及交通引导,并对规划城市空间提供基础支撑。

图6 基于核密度识别的广州市活力区和中心城区边界


4.3 与同类城市比较

类比纽约、伦敦东京巴黎4个国际一流城市,研究识别的广州市活力区介于东京都心6区和小巴黎范围之间;主城区面积与北京、东京、巴黎基本相当(见表3)。从识别的城市活力区和中心城区边界来看,城市发展范围已达到国际一流城市的水平。

表3 识别的广州市活力区和中心城区范围与同类城市对比

5.结语

大数据技术快速发展提升了数据获取性。本文基于手机信令、百度POI、腾讯位置数据的挖掘分析,获取了反应城市服务人口聚集和基础设施完善程度的人口综合密度、POI密度静态特征指标,以及表征交通网络供需状态下区域出行便捷程度和客流吸引强度的与可达性、商务休闲活动驻点密度动态特征指标。将4个指标归一化并加权处理后采取核密度法计算城市发展边界。以广州市实例分析验证了技术方法的可行性。本文从多指标综合分析角度定量化了城市发展边界识别方法,将现有的单一指标识别方法进行拓展,在注重人口聚集程度及设施完善程度静态指标的前提下,引入交通可达性和客流吸引强度等指标体现城市流动性对空间形态的影响,使得城市发展边界识别更符合实际,为城市管控政策实施提供更精确的支撑。本文仅从交通角度实现了城市发展边界识别,即物理边界的识别。实际上城市发展边界除物理发展边界外,还包括经济联系、社会文化联系及认同度,该方面研究仍待进一步加强。


参考文献:

[1] 周春山,叶昌东. 中国城市空间结构研究综述[J], 地理科学进展,2013,2(7):1030–1038.

[2] 王建伟,吴永平,刘昕. 都市圈圈层界定方法[J]. 建筑科学与工程学报,2007(2):91–94.

[3] 郭爱君,冯琦媛. 兰州都市圈空间界定方法研究[J]. 甘肃社会科学,2009(6):137–140.

[4] 刘鹏程,陈超,孔斌,等. 基于POI数据的镇江中心城区空间结构识别与特征解析[J]. 江苏城市规划,2017(9):7–12.

[5] 段亚明,刘勇,刘秀华,等. 基于POI大数据的重庆主城区多中心识别[J]. 自然资源学报,2018,33(5):788–800.

[6] 明英男. 基于网络开放数据的城市空间布局识别研究:以辽宁省盘锦市为例[C]//中国城市规划学会. 共享与品质:2018中国城市规划年会论文集. 北京:中国建筑工业出版社,2018:1073–1082.

[7] 陈映雪. 基于Webmap的多中心城市空间发展评估方法:以上海主城区为例[J]. 上海城市规划,2017(6):96–102.

[8] CHU H J, LIAU C J, LIN C H, et al. Integration of Fuzzy Cluster Analysis and Kernel Density Estimation for Tracking Typhoon Trajectories in the Taiwan Region[J]. Expert Systems with Applications, 2012, 39(10): 9451–9457.

[9] Xie Zhixiao, Yan Jun. Kernl Density Estimation of Traffic Accidents in a Network Space[J]. Computers Environment & Urban Systems, 2008, 32(5): 396–406.


作者简介

宋程(1983— ),男,湖北秭归人,硕士,主要研究方向:交通建模与仿真。E-mail: 510659684@qq.com





撰稿 |  宋程,陈嘉超,李彩霞,艾冠韬

编辑 |  技术咨询室

立足交通规划,当好政府参谋,引领城市交通建设


【声明】内容源于网络
0
0
广交研
内容 466
粉丝 0
广交研
总阅读292
粉丝0
内容466