点击上方文字关注长风数据君~

春节刚过,元宵将至,上班族都陆续回到了工作岗位,而学生党和老师们都还沉浸在浓浓的年味当中,各种吃吃吃、玩玩玩......
殊不知有一群学生早就研究了吃吃吃的科学道理,用大数据助力美好生活☟☟☟
▼数据驱动下的中小餐饮企业菜品优化管理▼
注:本研究使用的数据是来自河北某酒店半年的营业流水,共计十万多条, 以流水单为单位,里面包括每单流水的流水单号、时间、房间号、菜品名称、菜 品类型等信息。
提出问题
某酒店位于一片较为繁华的商业区,周边有大量的餐饮店与其竞争。为了在竞争中脱颖而出,酒店也想了很多的办法,但是效果都不明显,甚至最近出现了利润下滑。酒店面临着以下问题:餐厅的菜品数量是不是越多就越好?推出的套餐为什么顾客不愿意选择?营业额增长了为何利润不见涨?
分析问题
通过前期的数据处理工作,将分散的流水单进行合并,并对合并后的数据进行初步的清洗,得到了十万多条需要的流水记录。 删除多余的列,比如流水单表中的:消费区域、品项编号、小类编号以及消费时间。
将流水单中的重复菜品名称进行合并,共计合并了200 多道菜, 更正了30000 多条记录。同时我们还删除了100 多道已经被餐厅下架的菜品。

▼菜品分析▼
对酒店菜单的菜类(如荤菜、素菜、热菜、凉菜等)进行分析,得出酒店各类菜品的占比,为之后做套餐时的口味搭配提供帮助。

▼销售额分析▼
对每个月的总销售额进行分析,发现二月份的销售额特别高,经过进一步了解,发现酒店每年都有年夜饭套餐,但是只在二月份推出,这个套餐对后续的关联性分析有影响,所以在后面的分析过程中,将二月份数据进行了剔除。

▼运用 ABC 分类法和聚类分析法对菜品进行定位分析▼
➤ABC分类
对餐厅数据进行清洗分类后,将菜品按荤素、冷热等进行一轮归类, 然后分别计算出各单项菜品的销售额、销量在总销售额、总销量中的占比情况。 以 70%和 90%两个数值为分界点,给各项菜品进行标号。累计占比在 0~70%的标为A,70%~90%的标为B,大于90%的标为C。

当菜品的销量和销售额中有任一标号为A,就将此菜品标为明星菜品,如菜 品销量和销售额标号都为C,则标为淘汰菜品,除此以外所有菜品全部归入一般菜品。以该餐厅的橙汁马蹄为例,以流程图的方式展示完整的分析过程:

➤K-means聚类&SOW 聚类验证
用K-means聚类和SOW聚类方法分别将菜品分为三类,通过可视化结果,可以清晰看到 ABC 分析法和 K-means 聚类、SOW聚类分析法的结果具有很高的一致性,ABC 分析法的结果得到了验证。


➤菜品分类结果
对各菜品针对销售额、利润、销量三方面分级后,我们开始对单品进行三维分析,即以销售额、利润分级为 x 轴、y 轴,销 售量分级为 z 轴,根据各单品在坐标系中各轴坐标值,对各单品进行类型划分。 共分析出五类产品。

▼运用关联性分析寻找菜品搭配方案▼
先按照流水单将菜品进行两两组合,得到了菜品的组合数据库,之后我们将菜品组合的出现次数和菜品组合的支持度的变化趋势做了个对比,发现两条线的趋势基本一致,这就验证了关联过程的有效性。

之后根据整理出来的菜品的销量表、流水单表进行支持度、置信度和提升度的计算,最终筛选找出关联性强的菜品组合。

解决问题
▼菜品分类差异化营销▼
根据菜品分类结果,提出差异化营销策略:

▼套餐组合增效益▼
在菜品分类和关联性分析的基础上,推出套餐组合,例如也就是在招牌产品的组合中加入较少被购买的潜力产品,拉高潜力产品的销量来将其书面高利润转化为实际收益。
首先需要确定套餐的适用人数以及套餐内菜品数量,统计分析每一单各点了多少菜,结果如图:

菜品数量的出现次数随菜品数量增加呈正态分布,其中每单菜品数量在 4-6 道菜和 7-9 道菜的出现次数都很多。为了满足更多用餐群体的需求,决定制作一份包含 6 道菜的四人份套餐和一份包含 8 道菜的六人份套餐。
在制作套餐时,必须要保证套餐中的菜品都具有较高的关联性且具有较高的销量,于是我们选取了提升度和支持度在较高范围的关联性菜品组合,并分析出了这些组合菜品之间的综合关联性,来帮助我们选择挑选菜品。图中每个菜都对应一个圆环,圆环面积越大,说明该菜和其他菜的关联性越多也越强,这也为我们之后选菜提供了一个优先级的依据。

之后,我们注意到大海华招牌松花鱼 泡饼和其它菜的关联性最多。在此基础上,我们大海化招牌松花鱼泡饼为一级中心菜品,筛选出与其有较强关联性的二级菜品,共 10 道菜。

由于可供选择的二级菜品数量较多,所以我们进行了必要的筛选。二级菜品并非套餐的主体部分,所以不需要过分考虑菜品本身的销量如何,而应主要考虑菜品的利润,尽量选择一些利润高的菜品给餐厅带来更多的收益。最终我们在二级菜品中挑选出了 3 道高利润的潜力菜品:铁板黑椒煎小牛扒、干锅茶树菇以及马家沟芹菜拼扇贝肉。之后我们采用同样的方法,以挑选出的二级菜品 为中心,选出和其具有较强关联性的三级菜品,如图:

接下来是三级菜品的筛选,在罗列出与二级菜品关联性较强的所有三级菜品之后,我们只保留提升度在 1.2 以上并且和可供选择的二级菜品有重复的菜品,这样可以保证套餐菜品之间的强关联性,经统计,共有包括大海华招牌松花鱼泡饼在内的23道菜品作为套餐候选菜品。
查询了一些套餐搭配方面的资料之后,秉持凉菜与热菜搭配,荤菜与素菜搭配的原则,我们决定在六人餐中放两道凉菜,五道热菜和一份汤。并且这八道菜中包含了三道潜力菜,以求给商家带来更多的利润。在凉菜的选择上,选择了菜品分量较多的马家沟芹菜 拼扇贝肉和麻酱秋黄瓜。在热菜的选择上,我们本来选择了六道菜:松花鱼泡饼, 铁板黑椒煎小牛扒,巧吃羊腰,卷心菜炒粉丝和干锅茶树菇。但是考虑到某些特定菜品可能不合顾客的口味,所以我们又对套餐内的部分菜品提供了同类型的可替换菜品。并将西湖牛肉羹作为套餐内的汤品。四人餐的搭配过程和六人餐基本 相同,但是在此基础上要避免两份套餐里出现过多重复的菜品 。套餐搭配完成之后,我们为餐厅制作了套餐的点菜单,以方便餐厅进行套餐的推广。

2018年全国高校精英挑战赛
第二届“长风杯”大数据分析与挖掘竞赛
全国总决赛 二 等奖作品
学 校: 南京工业大学
团队编号: CF468
团队名称: 数据民工
指导老师: 吴志祥 王加中
队 长: 鄢晗晖
队 员: 包希璠 邓佳敏 任俊宇
声明:微信文章为独家原创,欢迎个人用户分享到朋友圈;其他任何形式的转载,请联系本公号取得授权,否则将追究法律责任。长风大数据(微信号:cf-dsj)隶属于Logis北京络捷斯特科技发展股份有限公司,简称:络捷斯特,证券代码:834832。

长风大数据(微信号:cf-dsj)基于多行业的海量数据资源,为企业运营和院校科研提供先进的数据挖掘分析工具,帮助用户释放数据价值、捕获深层信息。
联系电话:010-65568598转8013
电子邮箱:cfdsj@logis.cn
网址:http://www.cfdsj.cn


