大数跨境

基于聚类分析法的地铁与常规公交换乘客流分析

基于聚类分析法的地铁与常规公交换乘客流分析 广交研
2018-07-05
1
导读:运用层次聚类法、K-means聚类法对地铁站点进行区域分类及站点周边主导用地分类,开展常规公交与地铁接驳比例的聚类特征分析。结果显示,城郊结合区公交接驳比例大于中心区和外围区,居住型地铁站点公交接驳比

1 站点聚类

1.1聚类分析理论


聚类分析法是理想的多变量统计技术[1-2],聚类分析也称群分析、点群分析,是把相似的对象通过静态分类的计算方法,分别归入到不同的子集当中,通俗地讲,聚类分析就是根据事物彼此不同的属性进行辨认,将具有相似属性的事物聚为一类,使得同一类的事物具有高度的相似性。


同类事物在一定的测试下会具有很强的相似性,即同类事物之间的”距离“应很小,因此通过计算距离作为分类的依据。开始时,因每个样本自成一类,类与类之间的距离是相同的,然后在所有的类中,选择距离最小的两个类合并成一个新类,并计算出所得新类和它各类的距离;接着再将距离最近的两类合并,不断迭代直到所有的样本成为一类为止。


1.2按区域聚类


利用层次法对广州市既有轨道站点进行区域聚类,其基本算法为:首先将每一个样本视为一类,根据类与类之间的距离或相似程度,选择最相似的类加以合并,这样每合并一次就减少一类,不断重复这一过程,直到所有的样本合并到一类为止。经聚类,2016年广州市共134个地铁站点,聚类后形成三个相似度高的区域,其中中心区74个,城郊区47个,外围区12个。


1.3站点类型聚类


采用划分法中的K-means聚类算法进行聚类。K-means聚类也称为K-均值算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成,因此把得到紧凑且独立的簇作为最终目标。


根据地铁站点周边2公里范围所覆盖的用地类型的占比作为聚类因子如表1所示,同时把K设定为4类(居住型、办公型、商业型、枢纽型),计算得出每个地铁站点的分类如表2所示。

表1地铁站点聚类因子

表2 K-Menas聚类结果

2 地铁站点公交换乘接驳比例获取

2.1数据基础与关联匹配


目前,广州市单日公交IC卡刷卡数据约467万条,地铁站点进出闸刷卡数据335万条。两类数据具有共同属性IC卡号,以该属性为关联指标进行关联匹配,可以整合得到基于IC卡的常规公交与地铁全出行链信息,下表为某IC卡的关联信息示例。

表3公共交通刷卡数据整合表

2.2地铁站点公交换乘接驳比例计算方法


利用同一持卡号用户任意地铁刷卡记录与前后公交IC卡刷卡记录之间的时间差(T),判断公交与地铁是否属于换乘关系。在刷卡数据中,公交(B)已知上车时间,地铁(M)已知进出站时间,两者产生两种换乘类型,如图1所示。


地铁换乘公交(Metro to Bus)

根据公交站点核心服务范围[8],并且考虑出行者在换乘过程中可能产生的休息及步行、候车时间,将地铁换乘公交所能接受的最大换乘时间定确为25min,并作为地铁换乘公交的时间阈值T(mb)。


公交换乘地铁(Bus to Metro)

由于一票制公交没有记录下车时间,因此只能采用公交的上车时间与地铁站点的进站时间之差(公交的车内时间+换乘地铁时间)来判断换乘关系,将公交换乘地铁所能接受的最大换乘时间确定为45分钟[3],并作为公交换乘地铁的时间阈值T(bm)。


基于以上分析地铁站点公交换乘接驳算法实现流程如图2所示,根据上述算法,对公共交通刷卡数据整合表进行完整遍历后,计算得出广州市各地铁站点的换乘接驳比例如表4所示。

图1 换乘关系和换乘时间阈值构成

图2 地铁站点公交换乘接驳量计算流程

表4广州市各地铁站点的换乘接驳比例

3 公交与地铁接驳比例特征分析

根据前文的技术计算数据,将地铁站点属性作为是聚类分析的测度,运用前文介绍的聚类分析算法对地铁站点进行分类,进而分析不同分类的公交接驳比例。


3.1不同区域站点接驳比例特征


按行政区来看,由于白云区和番禺区紧邻广州环城高速,荔湾的芳村地区位于广佛交界地带,三区是近几年广州主城区人口疏散的主要地区,与广州最主要中心的直线距离均在10km左右,且上述区域现状轨道均成线性布局(未成网状格局),常规公交换乘诉求旺盛,换乘比例达到10%以上,成熟的越秀区和天河区由于轨道基本成网,且覆盖率相对较好,常规公交接驳比例相对较低。


如果将上述站点按中心区、城郊结合区、外围区三个层次[4]进行聚类分析,常规公交与地铁换乘比例特征呈现的层次关系更为明显。城郊结合区由于公交诉求强烈,且地铁覆盖相对不足,换乘接驳比例均值高达14.4%,中心区由于地铁覆盖率较高,且常规公交网络相对较好,二者平均换乘比例不高,约为7.4%,外围区由于本身公交系统不够完善,平均换乘接驳比例最低,仅为5.2%,这反应了外围地铁站的常规公交接驳及服务水平仍然存在一定差距,未起到对外围地铁站辐射的拓展作用。

表5广州各行政区地铁公交接驳比例聚类分析结果

图3不同区域的地铁站点公交接驳比例情况

3.2不同类型站点接驳比例特征


从站点周边主导用地属性聚类分析结果来看,居住型地铁站点的换乘接驳比例高达15.2%,办公型及商业型地铁站大多分布在中心区,其换乘接驳比例相对较低,另外枢纽型地铁站点如广州火车站、机场南站等地铁站点与常规公交换乘接驳比例也处于较低水平。

图4不同主导用地类型地铁站点的公交接驳比例情况

3.3不同区域与不同类型站点交叉分析


在上述聚类分析的基础上,按不同区域不同主导用地类型进行交叉聚类,计算不同类型的地铁站点在不同区域的公交换乘接驳比例(如表5所示),并以两个例子进行详细说明。


居住型站点在不同区域特征


城郊结合区具有更高的接驳比例,而中心区居住型站点接驳比例相对较低。举例而言,五羊邨站位于中心区,站点周边公交设施发达,地铁与常规公交可达性较高,地铁与常规公交接驳的需求不高,其公交接驳比例为6.8%;而西村站位于城郊结合区,其公交接驳比例高达27.1%,主要接驳客流主要来自于站点西北方向的罗冲围、松洲、鹅掌坦、同德围等地区,该区域由于京广铁路的阻隔,东向西道路不完善,只能由南北向道路承担集散功能,而西村站是南北向走廊内最近的地铁站,常规公交接驳地铁需求强烈。


办公型和商业型站点在不同区域特征


办公型和商业型站点在不同区域的特征具有一定相似型,如外围区的办公和商业型站点公交接驳比例均较低,而中心区的接驳比例约为城际结合区的一半左右。


枢纽型站点在不同区域特征


枢纽型站点无论是城郊结合区、外围区还是中心区,常规公交与地铁接驳的比例均较低,这与枢纽型站点配套服务城市对外枢纽到发客流特征相适应。

表6交叉聚类分析下公交接驳比例情况

4 结论与展望

利用公交IC卡数据和地铁闸机数据的关联,获取现状广州市各地铁站点的常规公交与地铁接驳比例特征,并进行站点聚类分析。分析结果认为,从区域特征来看,轨道基本成网、常规公交发达的中心区二者之间的接驳比例不高,城郊结合区由于轨道基本呈单线放射式布局,常规公交与地铁的接驳诉求较为强烈,外围区虽然有较强的接驳诉求,但由于自身常规公交系统欠发达,接驳比例仍然较低;从站点周边主导用地类型聚类分析来看,居住型站点的常规公交接驳比例明显高于办公型、商业型和枢纽型,且城郊结合区的居住型站点该特征更为明显。


目前国内多个城市已开通轨道交通,但绝大多数处于起步阶段,完善轨道交通接驳是客流培育的重要步骤之一。本文分析结论可以对相关城市的轨道交通衔接设施布局提供借鉴意义,一是轨道交通的接驳应重点关注城郊结合区域,通过强化城郊结合区域的轨道接驳来提升站点的辐射范围,进而扩大轨道交通的客流效益,二是接驳重点应放在居住主导型站点,通过接驳公交的布局,将主要居住区与地铁站进行串联,能提升轨道的服务效率和服务水平。同时,对于目前已经建设相对较为完善轨道交通的城市,研究结论亦可用于指导新一轮的轨道交通建设中,辅助轨道交通与常规公交一体化衔接研究,进而最大程度提升轨道交通的整体效益,缓解城市交通拥堵。

参考文献

[1] 周志华. 机器学习[M].北京:清华大学出版社,2016,197-224

[2] 姜园,张朝阳,仇佩亮,周东方. 用于数据挖掘的聚类算法[J]. 电子与信息学报,

[3] 广州市交通规划研究院. 基于公交IC卡数据的公交客流特征研究[R]. 广州:广州市交通规划研究院,2016.

[4] 广州市交通规划研究院. 2016年广州市交通规划模型维护、修正与校核[R]. 广州:广州市交通规划研究院,2016.

注:本文已发表在《科技和产业》期刊,2018年第5期。

第一作者简介:

作者简介:陈嘉超(1985-),男,学士,工程师,信息模型室,主要研究方向:交通规划模型。

E-mail:chankachiu@foxmail.com


第二作者简介:

作者简介:宋程(1983-),男,硕士,高级工程师,信息模型室,主要研究方向:交通规划模型。

E-mail: 510659684@qq.com


【声明】内容源于网络
0
0
广交研
内容 0
粉丝 0
广交研
总阅读0
粉丝0
内容0