大数跨境

物流&供应链|基于距离的选址模型(一)

物流&供应链|基于距离的选址模型(一) 长风大数据
2022-04-14
3
导读:选址对企业未来发展来说是一项重要决策,选址已经从“经验时代”转向了“数据时代”,本案例我们利用聚类方法实现配送中心选址分析,并利用“蓝鲸数据挖掘”平台实现基于距离的配送中心(Distribution


经常吃麦当劳的人会有印象:几乎每一个麦当劳店生意都是很火爆的。

      麦当劳生意火爆的原因除了品牌的因素外,店铺的选址也是至关重要的条件。麦当劳华东地区总裁曾这样表述:麦当劳之所以开一家火一家,第一是地点,第二是地点,第三还是地点。
      选址对企业未来发展来说是一项重要决策,麦当劳、星巴克等一线品牌的高级选址岗位年薪过百万,每一个点位都是对客户群体规模、人群画像、选址策略的高度凝练。



选址问题是运筹学中非常经典的问题,是指在规划区域里确定所要分配的设施的数量、位置以及分配方案,使得目标最优。这些设施主要是指物流系统中的节点,如仓库、配送中心、零售网点、制造商、供应商等。

解决复杂选址问题,需要考虑多种因素,如基础设施、物流成本、服务水平,甚至考虑房地产、劳动力成本和战略位置。



那选址一般用哪些方法呢?

如下图所示,根据定性法可以分为专家选择法、层次分析法;定量的方法具体可以分为线性规划法、重心法、聚类方法等。



      

当下,选址已经从经验时代转向了数据时代,本案例我们利用聚类方法实现配送中心选址分析,并利用“蓝鲸数据挖掘”平台实现基于距离的配送中心(Distribution Center,以下简称DC)选址模型。


1

选址任务

CF电子是一家电子产品生产企业,目前有6种主营产品,服务全国288个城市。随着客户量和客户需求的增加,目前的供应链运输网络面临成本高服务水平低的问题。
为了解决这种现状,降低运输成本,公司决定基于目前的运输网络进行选址分析,调整配送中心的配置。

在本案例的研究中,假设其他因素都是固定的,只考虑配送中心距离客户的位置,在此基础上来对选址问题进行分析。

案例假设如下:

1、已知客户的个数和分布位置;

2、已经确定需要的配送中心个数5个;基于以上假设将客户合理分配给配送中心。

2

技术思路    

1、首先需要量化地理位置信息量,本案例我们使用处理好的经纬度数据。

2、距离的计算,经纬度能确定一个点,两个点之间的距离是一个很好的量化指标。距离其实有很多计算方式,我们默认的“距离”一般指的是欧式距离,也就是两点的直线距离,对于小范围的选址问题,欧式距离即可求得比较理想的结果。

3、如何确定一个客户属于哪个DC呢?把它分配到离他最近的那一簇里面。距离怎么计算呢?用该客户到这一簇的“均值点”即可。其实就是一个聚类问题,最常见的是K-means。

聚类是指将物理或抽象对象的集合分成由类似的对象组成的多个类的过程。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。


K-means 算法步骤:


Step1:确定初始簇个数K

Step2:选择K个初始质心

Step3:计算所有样本与各质心的距离(本案例为欧式距离)

Step4:就近原则将样本分配到各簇

Step5:重新计算各簇的质心

Step6:重复Step3、Step4、Step5,直到该值小于阈值或达到迭代次数限制。

      

注意:K-means算法计算有两个重要参数,一个是设定好的簇的数量,也就是K值;一个是选用欧式距离计算距方式。

本案例中我们将K值暂且设定为5。

3

开始实战

本案例利用k-means聚类算法解决基于距离的选址问题,从288个城市中选取5个配送中心。

数据分析流程图

1、数据获取与展示

企业的“电子产品生产企业数据集”包括客户表,城市表和订单表。其中订单表中包含客户编号、客户名称、城市编号、产品、数量等,数据关系;利用平台的地图查看需求城市的地理分布:

2、聚类实现

本案例中我们选用地理位置作为聚类的数据,将簇的数量设置为5,关于数量的设置,还可以根据手肘法确定,如设置数量从2~8聚类选择合适的拐点(具体该算法的参数设置我们会另写文章详细介绍,这里不做深究)。

3、结果展示

最终我们通过聚类得到5个配送中心的位置,如图,每种颜色代表一个配送中心覆盖的区域。

  4配送距离计算    

计算出配送中心地址后,我们得到的是经纬度数据,如何计算配送中心到客户的距离呢?还需要将经纬度转化成球面距离。

球面距离

简简单单的小公式:

关于球面距离的计算,其中需要提到的是半正弦距离。它指的是球体表面上两点之间的角距离。假设每个点的第一个坐标是纬度,第二个是经度,以弧度表示,计算公式如下:

软件中我们可以通过构建特征工程实现:

配送中心确定后,整个物流网络中,配送中心到客户的总距离为54179.036km.

4

总结

本案例采用K-means算法实现基于距离的物流配送中心选址分析,但是实际选址中不仅要考虑距离因素,还需要考虑需求因素,比如哪些区域的客户需求大,原则上要离配送中心近一些,后续我们将继续探讨考虑客户需求的选址分析,也就是基于加权距离的选址模型,大家敬请期待吧!



本案例的数据及案例可通过进入“蓝鲸数据挖掘”官网获取。

点击公众号查看更多内容



【声明】内容源于网络
0
0
长风大数据
欢迎关注长风大数据,一起探索大数据/人工智能/智能装备等前沿技术的实战技巧。
内容 187
粉丝 0
长风大数据 欢迎关注长风大数据,一起探索大数据/人工智能/智能装备等前沿技术的实战技巧。
总阅读166
粉丝0
内容187