“夏季服装销量预测”为第五届长风杯大数据分析与挖掘竞赛竞技组赛题之一。
本项目以夏季服装销售量的预测为目标,通过历史数据分析与挖掘进行预测,为企业提供更有效的生产、采购决策,避免库存不足或利用率不高,实现企业的利润最大化。
*
团队名称:火箭队
团队成员:张语萱、李想、田丰、郭温志
指导老师:张雅静
学生院校:天津商务职业学院
老师院校:天津市第一商业学校
数据时代,数据变得越来越重要,“预测”也成为产业变革的重要力量。电商销量预测,需要结合业务提高企业利润。
蓝鲸大数据平台提供的数据集包含夏季服装的销售信息,属性包括产品说明、等级、是否使用了广告宣传以及已售出的产品数量等。
为有效帮助服装商品企划人员根据实际情况快速选择合适的服装销售预测方法,
对随机森林、线性回归、SVM模型及神经网络定量销售预测等方法从优缺点、优化历程及适用类型多个方面进行梳理总结,并对机器学习的部分组合算法进行举例与归纳。
随机森林:属于集成学习中的 方法,指的是利用多棵决策树进行训练与预测的一种分类器。
线性回归:利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。
SVM:是一个具有稀疏性和稳健性的分类器 ,又称为支持向量机,是一种二分类的模型。
神经网络:试图模拟大脑的神经元之间的关系来处理信息而建立的算法模型。
对数据进行观察与设置。
需要设置数据的类型,类目型、文本型等;需要设置数据的属性性质,如特征变量、目标变量与 元变量等。
项目挖掘评价、收入类、销售量和用户量指标。
针对购买夏季服装的客户等级、评分数量、产品价格、店铺广告宣发情况、国家来源、客户购买产品尺寸颜色等进行分析。
对数据集进行特征选择,通过不同变量的分布图、散点图,宏观观察产品属性。
通过相关性分析、特征排名等方法对数据进行特征筛选。
划分数据集为训练集和测试集。选择不同的模型进行建模,根据模型评估的数据不断调整模型超参数来优化模型。
通过大数据结合电子商务信息及其中的客户购买力,客户喜爱程度,店家的口碑进行整体分析,可以知道,
在运输费用上,不同地区相差价格较高;大部分店铺还没有进行广告宣传,如果能提升这部分的广告宣传,企业的销售额将会提高等结论。
项目通过多种算法进行建模,比较得出了效果较优的销量预测模型。
销售预测是商业智能的应用之一,通过机器学习算法模型能够提高预测精度。
预测模型应用时,需要考虑模型之外的其他因素,比如,流行趋势、供应链、库存能力等,如何识别利用这些因素,是销量预测的一种发展方向。
关注官网及微信公众号,了解大数据教研咨询!
关注我们
微信号|cf-dsj

