大数跨境

优秀作品赏析2|面向精准营销的动态权重RFM模型设计与应用

优秀作品赏析2|面向精准营销的动态权重RFM模型设计与应用 长风大数据
2020-01-16
1
导读:第三届“长风杯”大数据分析与挖掘优秀作品赏析,来自一等奖湖南财政经济学院凌云团队的投稿!

投稿来源:湖南财政经济学院|凌云团队



研究背景



在电商行业,随着大数据技术的发展,商家可以搜集到用户的消费记录,怎样挖掘消费者的特征和价值,以及如何有针对性的对用户进行精准营销,是商家最关注的问题,也是CRM的核心应用场景。



研究目的



运用真实的交易数据评估用户价值;筛选最优质的用户进行精准营销。



数据准备



巴西电子商务交易数据为例,计算出各指标的值。

R指标的计算:

R指标表示最近一次购买日期距离数据采集日的天数,将数据采集日定为2019年12月8日,R=数据采集日-最近一次购买日期。

F指标的计算:

用户消费的总次数。

M指标的计算:

用户消费的总金额。

指标计算结果截图



模型的构建



RFM模型在应用时需对指标离散化后再分析,常见的方式是分成五个等份,每个等份接近20%的用户,由于R指标的影响是负向的,值越小越好,F指标和M指标的影响是正向的,值越大越好。将R、F、M三个指标离散化后的得分进行组合,得到每一个用户的RFM得分(即RFMscore),得分越高,用户价值越大。

模型构建结果

基于RFM得分结合二八法则对用户进行分类,指标得分进入前20%区间赋值为1,另外80%赋值为0,三个指标进行组合,能够把所有用户分成八类。

用户分类结果



用户价值计算



为了更好的区分不同类用户的价值差异,引入动态权重计算单个用户的价值。

01

层次分析法计算主观权重



建立判断矩阵

根据巴西电子商务数据级交易产品特点,建立的判断矩阵如下:



归一化处理

得判断矩阵的特征向量W=(0.16,0.25,0.59)T。



计算最大特征根λmax,



一致性检验

一致性指标CI,

检验系数CR,

判断矩阵通过一致性检验,确立R、F、M指标主观权重分别为0.16,0.25,0.59。

02

熵值法计算客观权重



数据标准化

由于数据采集日定为了2019年12月8日,为了消除数量级带来的影响,首先对数据进行标准化处理。因为F指标和M指标对客户价值影响是正向的,采用第(1)个标准化公式,R指标影响是负向的,采用第(2)个标准化公式。



计算第i个样本下第j项指标的比重,



计算第j项指标的信息熵,

式中,k为波尔茨曼常数,



计算第j项指标的差异系数,



计算各个指标的权重,

利用程序计算R、F、M指标的客观权重分别为0.02,0.86,0.13。


03

综合集成赋权法确立最终权重

设Pj和Qj分别为R、F、M三个指标的主观权重向量和客观权重向量,最终权重计算公式为:

其中,k1和k2为合成系数(k1,k2>0,且k1+k2=1)

将主客观权重进行结合,确定巴西电子商务交易数据R、F、M指标的最终权重分别为0.14、0.33、0.52。

对标准化的R、F、M进行加权求和,得到每一个用户的价值得分:



筛选优质用户



以value_score这一列对数据进行降序排序,并筛选出价值得分位于前20%的客户,从下图可以看到,引入动态权重之后,价值最高的不一定是重要价值客户,以此评估的用户价值更加科学。



模型的应用



将构建好的模型应用于CDnow网站的销售数据和kaggle的某一零售数据。用户价值识别结果如下图所示。

CDnow网站销售数据

kaggle某一零售数据



现实意义



RFM模型能够快速的识别最有价值和最没有价值的客户,但是对于中间的客户没有办法进行区分,因为不同行业、不同领域的业务需求是不一样的,各指标的重要性也不一样。动态权重的引入能够更好的识别用户价值,量化用户价值差异,从而筛选最优质的用户实现精准营销。此外,动态权重RFM模型建立在传统RFM模型基础之上,能够适应不同行业的业务需求。


长风大数据(微信号:cf-dsj)

基于多行业的海量数据资源,为企业运营和院校科研提供先进的数据挖掘分析工具,帮助用户释放数据价值、捕获深层信息。

    联系电话:010-65568598转8007

    电子邮箱:cfdsj@logis.cn

    网址:http://www.cfdsj.cn


【声明】内容源于网络
0
0
长风大数据
欢迎关注长风大数据,一起探索大数据/人工智能/智能装备等前沿技术的实战技巧。
内容 187
粉丝 0
长风大数据 欢迎关注长风大数据,一起探索大数据/人工智能/智能装备等前沿技术的实战技巧。
总阅读166
粉丝0
内容187