4月22日,由教育部高等学校物流管理与工程类专业教学指导委员会和中国物流与采购联合会联合主办的“马钢杯”第六届全国大学生物流设计大赛圆满落幕。该比赛是教育部实施“质量工程”中的九项专业设计大赛之一,也是目前国内最具专业性、权威性、实用性的大学生物流设计大赛。
本次大赛历时共六个月,参与度高,规模、参赛人数为历届之最,logis大数据挖掘平台(PMT)助力武汉科技大学一队一路披荆斩棘,最终拔得头筹,荣获一等奖。
武汉科技大学一队的参赛作品是《基于大数据挖掘和物联网技术的晨钢智慧物流园区规划与管理设计》,该作品的第二章利用PMT对钢晨物流园区出、入库数据进行处理及可视化分析,为后续建模设计提供支持。
PMT在作品中的具体应用
1.数据预处理
武汉科技大学一队以螺纹钢HRB400E抗震的入库数据为例,运用PMT数据挖掘软件对其进行分析。
通过利用PMT数据挖掘工具,分析得出钢晨物流园区自2017年10月至2018年8月螺纹钢入库订单数据共有5724条,不同钢种、不同规格的螺纹钢入库频率差距很大;
螺纹钢HRB400的入库订单量高达3765条,入库时间跨度很小,单规格的钢材每天入库次数可高达10余次,同时钢材入库量达到上百件;
而螺纹钢HRB500在一年中入库订单只有7笔,入库时间跨度很大,其各规格数量更是偏少。
2.占比可视化分析
还可以将入库的件数依据总体入库件数划分为四个区间,分别为[0, 35.5)、[35.5, 60.5)、[60.5, 108.5)、[108.5, ꝏ),使落在每个件数区间内订单总数相同,即每个色块的长度是相同的~
这样可视化的效果更加清晰明了!
3.时间分布可视化分析
Y轴是月份,径向是日期(天),颜色深浅代表入库件数的多少,采用“SUM”聚合函数,将每天的入库量累加起来,从而可以清晰地对应出某月某日产生了多少的入库量~
还可以将径向参数设置为规格,轴向以月为单位聚合,形成螺纹钢HRB400E抗震在2017-2018年中不同规格参数的件数积累量的螺旋图~
4.时间序列图分析
生成螺纹钢HRB400E抗震在这一年中的入库数据时间序列图!
根据PMT中的数据预处理、占比可视化分析、时间分布可视化分析以及时间序列图分析得出结论:螺纹钢HRB400E抗震的入库时间并不是连续性的,入库量也是非规律性变化;螺纹钢HRB400E抗震的入库量随时间的推移呈现不规律的变化趋势。这为作品后续基于ARIMA和BP神经网络构建组合预测模型提供了有力的数据支撑!
那么。。。。。。
PMT是啥?
PMT究竟是什么?
PMT(Mining Tool Based on Python )是长风大数据开发的一款基于Python语言开发的数据挖掘分析工具,具有适合不同用户群体的多层架构,从无经验的数据挖掘初学者到喜欢通过其脚本界面访问该工具的程序员都将会有一个良好的使用体验。
PMT封装了包括机器学习,数据预处理和数据可视化等算法,目标是以一种最为简约的方式来解决具体业务场景中的问题,该工具的重点在于数据分析与挖掘,例如,安装库中的机器学习算法包含梯度下降法、朴素贝叶斯分类器、k近邻、决策树、随机森林、CN2规则、支持向量机、神经网络、Adaboost、线性回归和逻辑回归等。




其实PMT早就在Logis举办的“大数据分析与挖掘”竞赛中作为技术支持工具为两届参赛者提供过帮助,并且会在即将启动的“第三届大数据分析与挖掘竞赛”中继续亮相,敬请期待呦
长风大数据(微信号:cf-dsj)基于多行业的海量数据资源,为企业运营和院校科研提供先进的数据挖掘分析工具,帮助用户释放数据价值、捕获深层信息。
联系电话:010-65568598转8013
电子邮箱:cfdsj@logis.cn
网址:http://www.cfdsj.cn


