2020年第四届“长风杯”全国大学生大数据分析与挖掘竞赛已圆满结束,“长风大数据”公众号即日起将陆续推送本届大赛优秀作品展示。
本期将为大家展示数据分析与挖掘的思想和方法在交通物流方向的应用。
基于时空行为数据深度学习的优秀快递员揽收路径预测及其在新手指导上的应用
本期展示团队:
大渔猫
来自院校:
北京交通大学
浙江大学
中山大学
参赛方向:
创新分析类(A组)
交通物流方向
研究背景
如今,快递行业已经成为关系民生的重要行业,快递的揽收是其中一项重要的业务。快递员揽收过程中会产生大量的时空数据,如何利用这些时空数据去更好地指导快递员的揽收工作和开展对新手快递员的培训,是一个值得研究的问题。
研究目的
运用真实的快递员揽收数据,利用深度学习建模快递员的优秀经验和行为模式,并用于新手快递员的培训之中。
数据挖掘
我们对某地区60天内的近235,000条快递员揽收数据进行了分析和挖掘,总结出了新手老手平均每天揽件数的差异,展示了揽收订单的时间分布情况,揭示了新手、老手快递员在超时率、相邻揽收点间的路程和所用时间等方面上的差异。最后,我们运用了帕累托最优、卡方检验、回归直线等统计方法定性和定量地得出了老手快递员的路线规划确实比新手快递员的好,老手快递员的经验和选择偏好确实值得新手快递员学习这一结论。
模型构建
针对学习老手快递员的揽收经验这一问题,我们采用了一个基于注意力机制的解码器-编码器深度学习模型DeepRoute。此模型由三部分组成:决策偏好表示层、 Transformer编码层和基于注意力机制的循环解码层。模型结构如下图所示。
01
决策偏好表示层
在决策偏好表示层中,我们利用biLSTM从快递员本身信息和过往揽收路线中提取出了快递员的决策偏好p,然后利用类似词嵌入的技术对未揽收包裹的时空约束关系进行编码并与决策偏好p做哈达玛积,生成了与快递员揽收经验高度相关的未揽收包裹在张量空间的表示形式。
02
Transformer编码层
Transformer 编码层使用了Transformer 结构来捕获不同包裹之间的潜在关系,生成与输入顺序无关的对于单个包裹的编码以及对于整个未揽收包裹集合的编码。
03
基于注意力机制的循环解码层
基于注意力机制的循环解码层利用注意力机制从未揽收包裹集合中挑选包裹作为下一个要揽收的包裹,同时目前被挑选中的包裹又作为下一步解码的输入,最终整个揽收路线就这样被逐步地生成。
04
损失函数
我们将解码中的每一步都视为一个多标签分类问题,使用交叉熵作为模型训练的损失函数。由于快递员待揽收包裹情况是动态变化的,后续加入的包裹会改变当前的路线规划,对模型的判断产生影响。因此我们在训练时只使用那些排序结果不受后续加入包裹影响的包裹子集𝑄𝑡。
05
模型效果对比
具体应用
基于DeepRoute模型,我们提出了DeepRoute路线分析与推荐系统。该系统具备过往路线回顾与指导和实时路线推荐两大功能,能给予快递员“揽收时”+“揽收后”全方位的指导,能助力新手快递员的培训,具有培训难度小、培训成本低、培训效率高的优点。此模型可高效地运行在边缘设备上或云端上,便于部署和与现有系统结合,具有潜在的商业应用价值。
END
—— 长风大数据 ——
之后还有更多
优秀参赛作品展示
扫码关注 不要错过哦

