本文源数据和包含详细注释的源代码在后台回复 ' 用户价值分析 ' 即可获取
前言
「用户价值分析」能够帮助企业评估和衡量客户对营收的贡献程度。通过将用户划分为具有相似特征或行为的群体,企业可以更好地了解不同用户群体的需求、喜好和消费行为,进而有针对性地制定个性化的营销策略和提供定制化的产品和服务。
本实战数据集来自某网购平台下美妆个护品类的会员消费记录(时间跨度:2015年1月1日~ 2018年1月4日)。要点包括:
-
用户价值分析原理 -
实战建模 -
识别对价格敏感的用户 -
识别囤货用户
分析原理
RFM 模型的核心思想是通过三个关键指标——最近一次消费时间(R:recency)、消费频率(F:frequency)和消费金额(M:monetary),对客户进行细分和评估,以确定客户的活跃度、忠诚度和贡献度。
其优势在于灵活性,因为这些指标可以根据不同领域和产品特性进行调整。例如,在互联网产品中,R、F、M可以分别对应最近一次登录、登录频率和在线时长。




问题来了,得出这些类别后,又有什么用呢?RFM 模型最大的不足便是:它只能描述问题,但并不提供解决办法。
实战建模
因为 Python 实现 RFM 模型的全流程已经比较成熟,所以本次实战只展示建模结果和分析图,完整代码可在公众号后台回复“用户价值分析”获取。
数据探索
会员卡号:用户注册会员后,平台自动为其分配的唯一标识符。消费产生的时间:用户某笔消费产生的时间,精确到秒。商品编码与商品名称:每一个商品名称都对应着唯一标识编码。销售数量、商品售价:消费金额:消费金额(元)=商品售价×销售数量。此次消费的会员积分:一般情况下(除打折或不参与积分的商品),消费金额数=积分数,即1元相当于1积分。单据号:此次消费的电子单据号,唯一标识。出生日期、性别、年龄:用户的个人信息。
登记时间、是否为会员:用户成为会员的时间。登记后才能成为会员,
下面对理解数据集时可能出现的疑问做出了解释,这对了解业务背景很有帮助。
-
为什么有些记录会出现“有会员卡号但却不是会员”的现象(比如图中的前2条数据)?
原因可能有:
① 会员资格过期:用户曾经是会员,但会员资格已经过期。过期后用户需要重新申请或续费会员资格才能享受会员权益。
② 会员资格未激活:用户可能刚刚获得会员卡号,但还未激活会员资格。
-
时间跨度从2015 ~ 2018年,追踪的是同一批用户的消费行为吗?
是的,但当有新用户产生消费后,同样会被记录下来。所以,同一位用户可能会有多条“消费产生时间”的记录。同一用户在同一时间多次产生消费时(比如在某一个时间节点下单了多件产品),消费次数只算一次,会产生一个专属的单据号,即消费次数通过唯一单据号的数量来体现。
RFM 建模
篇幅原因这里不展示详细的代码,读者可自行文末回复关键字获取~,下图为对数据源进行 RFM 建模后的结果(部分)
一般来说,RFM分出的每类客户,都有着对应且通用的营销策略。比如,对R值、F值都比较低的客户进行唤醒和挽留;激励和发展那些R值、F值高但M值低的用户。其实在笔者看来,营销策略可以被概括为「发展」和「挽留」两大类(表17-12),只不过在面对不同类客户时,“发展”或者“挽留”的程度和手段不同而已。

-
真的要挽留吗?:重要挽回客户中可能有忠诚度高的囤货用户,这些用户其实很令人省心... -
真的要发展吗?:一般客户中可能有薅羊毛用户,我们发展他们干嘛...
下面展示一些更加贴合业务实际的用法。
模型分析

得出客户M值、F值的分布情况,对企业营销策略的选择非常有帮助:
① M(平均消费金额):M的高低对应不同的优惠力度和手段。
② F(消费频次):F的高低对应不同的唤醒或挽回的手段。
从上表中,我们需要重点关注:
-
实线方框内数字中可能存在「对价格敏感的客户」(F、M都低)和「喜欢囤货的客户」(F低、M高) 虚线方框内数字中可能存在「忠诚度高但对价格敏感的客户」(F高M低,多在有优惠时出现)。
模型指导实际业务
F、M矩阵分析帮我们找出了需要重点关注的两个客户群,下面进一步细化
识别对价格敏感的客户

上图中会员卡号为 c3e32cdc 的用户,仅用10元就将原价710元的商品买到手了。对待这类专薅新客优惠的羊毛党,平台既要防止他们滥用优惠规则,又要保持对真实用户的吸引力。
如可根据用户的购买历史和行为习惯,针对性地提供优惠;也可验证用户身份,例如要求提供手机号码、邮箱地址或其他相关信息,以验证新用户的真实性,防止恶意利用平台规则漏洞获利的行为。
识别囤货客户

小结


感兴趣的朋友可以看看:


