大数跨境
0
0

美妆平台会员价值分析

美妆平台会员价值分析 数据分析与商业实践
2024-07-23
1
导读:新书速递,业务分析实战案例




本文含 3118字,13 图表截屏
4 ~ 分钟即可读完


本文源数据和包含详细注释的源代码在后台回复 ' 用户价值分析 ' 即可获取

前言

「用户价值分析」能够帮助企业评估和衡量客户对营收的贡献程度。通过将用户划分为具有相似特征或行为的群体,企业可以更好地了解不同用户群体的需求、喜好和消费行为,进而有针对性地制定个性化的营销策略和提供定制化的产品和服务。

本实战数据集来自某网购平台下美妆个护品类的会员消费记录(时间跨度:2015年1月1日~ 2018年1月4日)。要点包括:

  • 用户价值分析原理
  • 实战建模
  • 识别对价格敏感的用户
  • 识别囤货用户

分析原理

用户价值分析主要有分群分析、终身价值(CLV)分析、同期群分析等,篇幅原因本文只介绍分群分析中的 RFM 分析,并把重点放在 RFM 的实际应用上,这也是很能体现数据分析师水准高低的一个业务模型。

RFM 模型的核心思想是通过三个关键指标——最近一次消费时间(R:recency)、消费频率(F:frequency)和消费金额(M:monetary),对客户进行细分和评估,以确定客户的活跃度、忠诚度和贡献度。

其优势在于灵活性,因为这些指标可以根据不同领域和产品特性进行调整。例如,在互联网产品中,R、F、M可以分别对应最近一次登录、登录频率和在线时长。

除了划分标准统一且明确的行业,比如航空公司和酒店行业,依据百分位规则划分的方式会将数据转换成1~5分的计分,分值越高代表价值越高,一般可以按20%/40%/60%/80%分位数将数据计为1~5分。

得出三个指标的打分后,还需要把分值进行转换,这样才能进一步对用户进行划分。下图是其中最常用的一种计分方式,将1~5分的分值按对应的平均值进行划分,划分成0和1,数字0代表该指标下的低价值群体,数字1则代表高价值群体。

把用户按照R(最近一次消费)、F(消费频率)、M(消费金额)三个指标各自分层后,可以将其组合起来考虑,把用户划分为8类。

问题来了,得出这些类别后,又有什么用呢?RFM 模型最大的不足便是:它只能描述问题,但并不提供解决办法


实战建模

因为 Python 实现 RFM 模型的全流程已经比较成熟,所以本次实战只展示建模结果和分析图,完整代码可在公众号后台回复“用户价值分析”获取。

数据探索

本实战数据集来自某网购平台下美妆个护品类的会员消费记录(时间跨度:2015年1月1日~ 2018年1月4日),数据预览如下:
参数说明:
  • 会员卡号:用户注册会员后,平台自动为其分配的唯一标识符。

  • 消费产生的时间:用户某笔消费产生的时间,精确到秒。

  • 商品编码与商品名称:每一个商品名称都对应着唯一标识编码。

  • 销售数量、商品售价:消费金额:消费金额(元)=商品售价×销售数量。

  • 此次消费的会员积分:一般情况下(除打折或不参与积分的商品),消费金额数=积分数,即1元相当于1积分。

  • 单据号:此次消费的电子单据号,唯一标识。

  • 出生日期、性别、年龄:用户的个人信息。

  • 登记时间、是否为会员:用户成为会员的时间。登记后才能成为会员,

    如果不是会员,则用户的个人信息和登记时间都为NaN。

下面对理解数据集时可能出现的疑问做出了解释,这对了解业务背景很有帮助。

  • 为什么有些记录会出现“有会员卡号但却不是会员”的现象(比如图中的前2条数据)?

原因可能有:

① 会员资格过期:用户曾经是会员,但会员资格已经过期。过期后用户需要重新申请或续费会员资格才能享受会员权益。

② 会员资格未激活:用户可能刚刚获得会员卡号,但还未激活会员资格。

当然还可能存在会员卡号泄露、冒用或登记错误的情况,这些较为特殊,不在本案例的考虑范围内。
  • 时间跨度从2015 ~ 2018年,追踪的是同一批用户的消费行为吗?

是的,但当有新用户产生消费后,同样会被记录下来。所以,同一位用户可能会有多条“消费产生时间”的记录。同一用户在同一时间多次产生消费时(比如在某一个时间节点下单了多件产品),消费次数只算一次,会产生一个专属的单据号,即消费次数通过唯一单据号的数量来体现。

RFM 建模

篇幅原因这里不展示详细的代码,读者可自行文末回复关键字获取~,下图为对数据源进行 RFM 建模后的结果(部分)

一般来说,RFM分出的每类客户,都有着对应且通用的营销策略。比如,对R值、F值都比较低的客户进行唤醒和挽留;激励和发展那些R值、F值高但M值低的用户。其实在笔者看来,营销策略可以被概括为「发展」「挽留」两大类(表17-12),只不过在面对不同类客户时,“发展”或者“挽留”的程度和手段不同而已。

例如,对重要价值客户和一般客户的发展策略:前者的忠诚度高,只要在保持一定关注度的同时提供一些专属优惠即可,而后者就需要多增加关注并融入一些积分奖励的手段来刺激消费。
需要注意的是,如果只是简单地将策略应用在某一类下的所有客户身上,难免会出现一些潜在问题。比如:
  • 真的要挽留吗?:重要挽回客户中可能有忠诚度高的囤货用户,这些用户其实很令人省心...
  • 真的要发展吗?一般客户中可能有薅羊毛用户,我们发展他们干嘛...

下面展示一些更加贴合业务实际的用法。


模型分析

指标R反映客户最近一次购买的时间,它能够衡量客户的活跃度。在某些行业中,比如快消品或日用品,客户的消费频率一般较高,因此虽然R很高,但并不是首要关注的指标。而在其他一些客户购买频率较低的分类中,比如高端奢侈品或大型家电,R指标虽然低但也会成为评估客户活跃度和忠诚度的重要依据。
本章案例属于美妆个护领域,主要是快消品和日用品,所以更贴合实际的做法是优先考虑 F 和 M,最后再看 R。下面将使用矩阵法来综合考虑F和M,以实现对不同客户群体的深入分析。
下面先用建模结果表里面的“F_score”和“M_score”来做一个列联表分析:

得出客户M值、F值的分布情况,对企业营销策略的选择非常有帮助:

① M(平均消费金额):M的高低对应不同的优惠力度和手段。

② F(消费频次):F的高低对应不同的唤醒或挽回的手段。

从上表中,我们需要重点关注:

  • 实线方框内数字中可能存在对价格敏感的客户(F、M都低)和喜欢囤货的客户(F低、M高)
  • 线方框内数字中可能存在忠诚度高但对价格敏感的客户(F高M低,多在有优惠时出现)。


模型指导实际业务

F、M矩阵分析帮我们找出了需要重点关注的两个客户群,下面进一步细化

识别对价格敏感的客户

对价格敏感的用户通常会在活动促销(比如节日满减)和产品特价(捆绑销售、新品特价和清仓处理)时才购买,所以F值和M值都会比较低。
对价格敏感的用户群中,有一类特别关注新客优惠的群体,他们在数据集中的特点为:F值等于1,且在消费时使用优惠,即商品售价大于消费金额。

上图中会员卡号为 c3e32cdc 的用户,仅用10元就将原价710元的商品买到手了。对待这类专薅新客优惠的羊毛党,平台既要防止他们滥用优惠规则,又要保持对真实用户的吸引力。

如可根据用户的购买历史和行为习惯,针对性地提供优惠;也可验证用户身份,例如要求提供手机号码、邮箱地址或其他相关信息,以验证新用户的真实性,防止恶意利用平台规则漏洞获利的行为。


识别囤货客户

喜欢囤货的用户特点一般是 F 值低 M 值高,且通常倾向于在促销活动期间、节假日前、新品上市期间以及季节转换等几个时间节点开始囤货。
筛选出囤货用户后可以有针对性地进一步研究,以实现精准营销。下面将筛选出F值为1、2且M值为4、5的囤货用户。

面对这些用户,我们可以考虑有针对性的促销活动和限时优惠、老客户回馈计划、产品推荐和新品预告/试用等。

小结

RFM模型可以很好地衡量用户对企业的价值,对企业的精准营销很有帮助。但需要注意的是,在现实中,RFM只能描述问题,不能解释问题发生的原因,更无法提供解决方案。所以我们需要结合实际业务并利用好该模型指标清晰的优势,从而深入理解用户行为背后的动机和原因。
像这样的案例,我的新书《Python数据分析实战--思路详解与业务实践》中还有很多,而且还包括了数据分析师必备的统计学和机器学习算法知识。通过把理论与实践进行深度的融合,做到可以直接应对面试的理论问答级别。

感兴趣的朋友可以看看:



【声明】内容源于网络
0
0
数据分析与商业实践
丰富的 Python 数据分析实战案例
内容 50
粉丝 0
数据分析与商业实践 丰富的 Python 数据分析实战案例
总阅读14
粉丝0
内容50