大数跨境

产品推荐和先后购买(下)

产品推荐和先后购买(下) 朗玛峰论坛
2023-01-28
1
导读:理解不同层面的重复性。

三、垂直推荐:先后购买产品的推荐

第二节根据顾客或者产品的相似性讨论了产品推荐问题,分析过程中完全不考虑顾客购买的先后顺序。但在更复杂的情况下,即便计算出的是相似顾客或者相似产品,也需要按照顺序来进行推荐。第三节和第四节则讨论这种情况下的推荐问题。


1、有购买顺序的产品类型

顾客大多数情况下购买产品都没有先后顺序。例如,顾客今天买了件衣服,明天买了点零食,后天买了管牙膏。顾客购买这三种物品虽然时间上有先后,但实际并不存在一个固定的先后顺序。另外一个顾客完全可能按照相反的顺序购买,甚至买完了衣服后,很长时间内根本就不买牙膏或零食。这种情况下,我们很难根据顾客购买的前一个产品来推测他会购买的下一个产品。


另外,顾客购买的某些产品存在相对确定的先后顺序。例如,顾客会先买房、后装修、再买家具。这些行为具有相对明确的先后顺序。不过这已经可以通过销售人员的经验或者智慧来预测。


除此之外,还存在一些看起来并不那么明确的先后顺序。例如,买方和一个新的卖方打交道,刚开始购买的往往是一些低风险产品(例如,价格不高的产品)。随着买卖双方不断互动,买方对卖方及其产品更为了解,多次互动中卖方也没有亏待买方,卖方在买方那里逐渐积累起了信任。买方于是会开始从卖方那里购买风险高一些的产品,例如买方缺少经验的新产品或者万一出现问题损失较大的高价值产品。这时候,买方购买产品实际上有个逐渐“升级”的过程,先买低风险产品,再买高风险产品。例如,顾客和银行打交道,通常是先开储蓄账户,先存款,然后会办信用卡,后续会购买相对稳健的理财产品,再后续会购买风险更高的股票型理财产品。甚至因为对银行的信任,顾客会通过银行购买人寿保险。这些购买的先后顺序很难一眼看出,但实际上暗含着一条随信任增长所购买产品风险提高的主线。如果分析多个用户的购买历史,是有可能通过计算发现这个顺序并用于推荐决策的。


本节就针对这种并不明显的先后顺序来探讨如何通过数据进行预测。从简化定位的角度,本节的内容可以当作解决连带销售(cross-selling)中的产品推荐问题。f企业希望顾客买了A产品后,将来还买B产品。企业当然可以一股脑儿地向顾客推荐所有产品,但一是效果不好,二是成本太高。吸引顾客关注企业是需要支付成本的。同时看到多个推荐产品,顾客也没有足够的精力来逐一了解。企业通常是预测顾客买了A产品以后,更可能购买其余产品中的哪一个,然后把这个成交可能性高的产品推荐给他。


本节以顾客和银行的交往为例进行分析。根据前面的分析,这种先后顺序并不局限于银行业,先后购买行为暗含的主线是风险和信任,这在很多行业是一样的。模型或者算法要解决的问题有两个:(1)顾客购买了某产品后,会购买的下一个产品是什么?(2)顾客什么时候会买我们预测出的下一个产品?


2、独立预测顾客要购买的下一个产品

为了预测顾客购买的下一个产品,首先要从企业的现有数据中提取相关数据,其次要建立一个合适的预测模型,再次用数据拟合出模型中的各种参数,最后才能用拟合出的模型预测顾客下一个产品会买什么。其中的关键是准备数据、模型拟合这两步。


(1).预测所需要准备的数据

预测的基础是顾客在某个时间节点前后都买了什么,也就是常说的T阶段数据和T+1阶段数据。从数据颗粒度来说,需要的是顾客个体的购买行为数据,而不是顾客群的整合或累积数据。简单来说,所需的就是谁、什么时间、买了什么、花了多少钱。更通用的需求就是时间点和发生的行为。通常进行预测还需要一些其他方面的数据,例如人口统计信息。如果有企业在T阶段的营销活动数据,也应该考虑进去,这会影响顾客在 T+1阶段的购买行为。表3-1和表5-1是我们之前使用过的类似数据。


表3-1显示了单一顾客的行为信息,表5-1显示了多个顾客的背景信息。企业通常并不会直接存储表3-1和表5-1这样的表格,实际存储的通常是按照时间排序的所有顾客的行为。到用的时候,企业需要从数据库中挑出单一顾客的行为构成表3-1。


如果企业留存有营销数据,则留存的数据内容通常如表7-6所示:

表7-6中的第八列通常是和另外的数据表拼合后形成的。例如,如果顾客在表3-1中有购买行为,则对应表7-6第八列“顾客响应”就是“购买”,相应地也会有一个与“购买”对应的响应行为ID。


有了类似表3-1、表5-1和表7-6的数据,我们就可以采用某种预测模型对数据进行分析了。


(2).模型拟合

预测的基本思路是计算顾客购买每个产品的概率,然后选择购买概率最高的产品向顾客推荐。


之前介绍过多种模型用于预测顾客的购买概率,这里就用式(6-5)来解决问题,如下所示:

根据本章的任务,我们对模型稍加修改,新的公式如下所示:

式(7-5)等号的左侧表示概率,取值0~1。式(7-5)表达的是顾客i下一次购买产品j的概率,这里用i代表数据中的任一顾客(表5-1和表7-6的数据中都包含多个顾客),用j代表数据中的任一产品(表3-1包含多个产品),k对应表5-1或者表7-6中的某一列,代表影响顾客购买的某个因素。


式(7-5)等号的右侧分母中Xijk代表第k列的数据用于预测顾客i购买j产品的概率。实际计算时,程序会读取表3-1、表5-1和表7-6那样的数据,然后基于多列(当作多个维度),计算每个顾客购买每个产品的概率。最终计算出来的购买概率最高的那个产品,就是应该向顾客推荐的产品。


最初阶段需要拟合(就是计算)参数βijk时,T阶段的数据已经显示顾客购买了哪些产品,也就是已经知道了购买概率最高的产品是哪一个。计算机程序要找到一套βijk参数组合,使得i顾客购买j产品的概率最高(常常采用的是最大似然估计法)。更复杂的情境下,只有当顾客购买产品j的概率超过某个阈值时(即Pr(顾客i购买产品j)>Thresholdij),顾客才会购买产品j。阈值Thresholdij可以是随顾客i和产品j变化的数值,可以是第三章提到过的某个概率分布,可以用当时提到的类似方法估计。


3、已购买产品对未来购买产品的影响

我们可以使用式(7-5)这样的方法,独立计算顾客购买每个产品的概率。虽然也可以按照此思路计算顾客在电商平台上购买的所有产品,但实践中我们很少这样做。这是因为:第一,实际上未必存在这样的先后顺序(例如第二节水平推荐针对的情况);第二,电商平台上的产品数量过多(通常有几十万个SKU),计算既耗时,得出的结论也不稳定。不过,如果聚焦于电商平台上的某个店铺或者线下某个企业,会发现它们实际销售的产品(或者产品类别)并不多。正如图7-1所示,视角不同时,观察顾客购买行为的层次也会不同。例如,可供顾客挑选的产品很多,但从品牌角度来看数量就要少很多;如果从品类角度来看,可供挑选的品类数量就更少了。切换到图7-1更靠右侧的视角来分析顾客的购买行为,即便预测的精度到不了产品层级,至少也有助于判断顾客要购买的品牌或者品类。


本节关注的重点是预测顾客购买某产品m以后,下一步购买产品j的概率。其中m和j代表产品集合set中的任一产品,即m和j都属于集合set(m∈set,j∈set)。m和j代表同属于产品集合的两个产品,有时甚至可以是同一款产品(即买过某产品以后再次购买该产品)。


原文[①]作者采用了一个称为概率比(odds ratios,OR)的指标来衡量这种产品购买的先后关系。这个指标在不同专业领域(例如,医疗、统计等)有不同的名称,使用那些名称容易引起误解,所以这里就用概率比这个直白的叫法。OR的定义如下:

上述公式的分子和分母都是根据式(7-5)计算得出的。分子的含义是顾客买过产品m后再购买j产品的概率,它是个条件概率。分母是顾客没有买过产品m直接购买j产品的概率。


实际计算时,并不直接计算分子的条件概率,而是把所有顾客分成买过产品m和没有买过产品m两类,然后把两类顾客购买产品j的概率相除即可。如果OR>1,即Pr(顾客i购买产品j|顾客已经买过产品m)>Pr(顾客i购买产品j),这意味着顾客购买产品m之后购买产品j的概率有所提升,也就是购买产品m带动了购买产品j。反之,如果OR<1,意味着购买产品m对购买产品j有妨碍。


如果企业的目标是销售产品j(这往往是因为产品j利润高或者是对企业未来更有价值的战略性产品),那么,当OR>1时,企业应该先向顾客推荐产品m,这比直接推荐产品j更容易成功;当OR<1时,企业应该直接向顾客推荐产品j,甚至为了售出产品j而阻止顾客购买产品m。当然,这里说的是决策的方向,具体的推荐行为和阻止行为的力度,还要看OR的值。以1为分界线,OR越大,越要首先推荐产品m;OR越小,越要尽力阻止顾客购买产品m。


为了便于读者理解并应用于企业的业务场景,这里复制了原始论文用银行业务生成的数据表,如表7-7所示。原文中的产品对应关系如下:A.基本支票账户;B.超过一定额度的支票账户;C.基本储蓄账户;D.超过一定额度的储蓄账户;E.定期存款。因为中美两国银行体系不一样,中国的银行并不存在对私的支票账户,读者可以按照一类账户和二类账户之类的逻辑理解表中的数据。本书的目的不是介绍银行业务之间的前后关系,我们更多地关注计算逻辑就行了。特别说明一下,A、B、C、D、E并不代表任何顺序含义,你把它们当作某个随便赋予的代号即可,就类似于张三、李四、王五、赵六。

表7-7突出显示了大于1的OR值,如果产品E(原文中是定期存款)是企业的重点业务,那么首先应该向已经有定期存款E的客户推荐新的存款业务(OR=4.94),其次应该向具有超过一定额度储蓄账户D的客户推荐(OR=1.66),最后应该向其他开设有基本储蓄账户C的客户推荐(OR=1.36)。如果客户已经开设了支票账户(A或B),则向他们推荐定期存款的成交概率反而会下降,还不如一开始就直接向他推荐。这里重复原文的结论只是为了便于读者理解OR的应用和式(7-5)计算结果的含义。中美两国情况不同,结论未必有价值。


4、把前一个产品的购买时间纳入考虑

表7-7显示的结果结合一些行业特点和业务知识,已经能够帮助企业理解顾客购买产品时隐含的一些先后顺序。除此之外,企业在未来某段时间(例如几周或一个季度)开展营销活动时,还想知道应该瞄准哪些顾客。精选高成交潜力顾客既有助于节省营销费用也能减少对其他顾客的营销打扰。在一些营销推送受到严格管制的地区,减少打扰甚至比节约营销费用更为关键。这两种情况下,计算顾客的成交概率时,不仅要考虑产品,还要考虑顾客的购买时间段。


要找出未来一定时间内最可能购买主推产品(例如高利润产品)的顾客,既需要知道有助于提高主推产品成交率的前置产品是哪一个,也需要知道顾客在未来一定时间内购买前置产品的概率。如果顾客未来一定时间内(例如一个季度)购买前置产品的概率很低,那么无论他购买前置产品后购买主推产品的概率有多高,因为购买前置产品这件事情很难发生,购买主推产品就成了无源之水、无本之木。上述过程可以按照条件概率的思想进行表述。事件P(previous)代表顾客未来一定时期内会购买企业某产品,核心是会购买而且要在一定时期内发生。事件N(next)代表顾客下一个购买的是主推产品。那么,在营销期间内,顾客最终购买主推产品就需要事件P和N都发生,也就是顾客既要买前置产品(事件P),买了前置产品后还要买主推产品(事件N)。用概率表示即:

式中,Pr(previous & next)代表事件P和N都发生的概率,也就是营销期间顾客会购买主推产品;Pr(previous)是顾客购买前置产品的率;Pr(next|previous)是顾客购买了前置产品后购买主推产品的概率。我们用式(7-5)能计算出产品m的Pr(previous)。通过把顾客分成买了产品m和没有买产品m两类,然后分别计算其购买产品j的概率。其中,买了产品m的那些顾客购买产品j的概率就是Pr(next|previous)。m和j只是表述时用的产品编号,其实需要针对所有的产品用式(7-5)计算一遍。


我们可以依托式(7-6)回顾成交条件。营销活动要带来实际销量(即活动期间内顾客最终购买了主推产品),既需要顾客购买前置产品后购买主推产品的概率高(从表7-7能够知道的),还需要顾客在营销期间(例如一个季度)购买前置产品。如果顾客在此期间购买前置产品的概率很低,那么即便后面的概率很高,两者相乘后,总体的概率仍旧不高。


道理清楚了以后,我们首先要计算顾客在一定时期(即时间t)内购买前置产品的概率。企业通常有整个顾客群的购买概率(即一群顾客中有多大的比例会购买),可以以此为基础,考虑每个顾客的个体特点(表5-1那样的数据),计算出每个顾客在时间t的购买概率。


我们可以借用式(6-6)来计算顾客不购买的概率,用1减去这个不购买的概率就得到了购买的概率。式(6-6)如下所示:

不必拘泥于式(6-6)原来要解决的问题和所有的符号,只需理解计算的逻辑即可。最初的比例风险模型使用的符号是H(t;X)=H0(t)^βX,H是hazard(即风险)的缩写。H(t;X)原意是有特征X的顾客在时间t内流失的风险。特征X对应表5-1和表7-6中的那些列。式(7-5)引入这些代表特征X的列,计算了顾客最终会购买产品j的概率,但是没有告诉我们这个“最终”要经历多长时间。采用式(6-6),我们还是用这些列,但引入了时间t以后,就能知道顾客在时间t内购买的概率了。H0(t)是顾客流失(即不再购买)的基础概率,与某个顾客有关的X通过在指数位置即 H0(t)^βX施加影响最终形成该顾客个体的流失概率H(t;X)。流失的概念界定就是“在时间t内没有发生购买行为”。那么“1-H(t;X)”就是顾客在时间t内购买的概率,也就是顾客在时间t内的Pr(previous)。


有了顾客在时间t内的Pr(previous)和Pr(next|previous),按照式(7-6)自然能够计算出顾客在时间t内的 Pr(previous & next)。t可以根据营销活动的计划,例如一个月或者一个季度来设定。


有了每个顾客在未来时间t内的购买概率,就可以按照购买概率的高低,将顾客进行排序,然后针对购买概率高的顾客先开展营销活动。这里的营销活动泛指各种市场推广活动,可以是电话呼叫、发短信、推送公众号文章、提供促销折扣等各种具体操作。具体是针对购买概率高的前5%还是前10%、25%或者50%,取决于企业在这方面的营销预算和对活动响应率的要求。这是个管理决策问题,而不是模型计算的问题。当然,企业可以用另外的模型计算什么样的投入产出比对企业最优,以此来辅助管理决策。这属于另外要解决的问题,不是本章的关注点。


四、垂直推荐:量化前后购买产品之间的距离

我们在第三节弄清楚了顾客购买产品的先后顺序,理解了实践中需要按照一定的顺序向顾客推荐产品。顺序推荐比同时向顾客推荐多个产品或一开始就向顾客推荐主推产品有了很大的改进。


服从于业务发展的需要,企业有时会有几款主推产品。它们与需要顾客首先购买的产品(前置产品)之间同样存在后置关系。后置产品与前置产品之间的距离并不总是一样的,会随着产品的不同而变化。这里的距离也许是顾客购买后置产品与购买前置产品之间的时间间隔,也许是顾客心理成熟度的改变程度,也许是顾客风险承受力的提升程度。本节从前后产品的距离角度,探讨推荐后置产品要跟顾客购买前置产品保持的最小距离。


1、购买产品先后之间存在距离的简化例子

在第三节我们知道了顾客购买产品存在先后顺序,但并不清楚这个先后之间的距离。在实践中,顾客的需求有一个自然的演变过程。向顾客推荐的产品要尽量与他当时的需求同步。推荐的产品与顾客需求越接近,顾客购买的概率越高。第二节介绍水平推荐的时候,我们更多的是考虑产品与顾客偏好的相似度。这类似于要向四川人推荐麻辣菜品。本节考虑距离的时候,更多的是考虑产品与不断变化的需求的匹配度,这类似于要等从外地迁入四川的人居住几年以后才向他们推荐麻辣菜品。


我们用个稍微复杂点的例子来说明情况。后面还会提到这个例子,为便于读者理解将这个例子命名为“例子7-1”。如果观察某个顾客的购物历史,发现她过去几年间先后购买过下列产品:t1.婴儿床;t2.婴儿尿布;t3.奶粉;t4.声响玩具;t5.学步车;t6.亲子课程;t7.周边游;t8.舞蹈培训班;t9.书包;t10.文具等。其中有些产品是重复性购买,另外一些产品只购买过一次。我们按顺序给每个产品编了号,假设每个编号对应一个时间点(用tj来表示)。


大致观察和思考一下顾客购买产品的变化,多数人都能猜出这是家长在根据孩子的成长阶段,购买其当期需要的产品。t1和t2是婴儿需要的产品,而t10是要上小学的孩子需要的产品。家长是在根据孩子的成长选择匹配的产品。孩子的成长是个变化的过程,而产品本身是固定不变的。即t1始终是婴儿阶段的产品,而t10始终是上学所需的产品。产品的位置(即它所满足的需求)并不因为孩子的成长而发生变化。所以,多个产品和多个成长阶段之间的匹配,实际上是个成长阶段在变而产品固定的过程。


上述过程中,如果需要推荐产品,则所推荐的产品要与顾客的当期需求匹配才行。注意,产品本身的定位并没有变化,应该推荐跟孩子所处的阶段最接近的产品。这可以想象成一个人坐在行驶着的汽车上,伸手去抓路边离得最近的物品(这个例子标注为“例子7-2”)。物品是沿道路放置的,位置始终没变,但车在动,导致每次离人最近的物品不断变化。顾客第一次(即t1)购买的时候,向其推荐奶粉,距离是t3-t1=2;如果推荐的是文具,距离是t10-t1=9。例如,在孩子小的时候,家长看到奶粉广告有可能买奶粉,但看到文具广告时购买文具的可能性就很小。这跟产品好坏无关,而跟广告和顾客需求的匹配度有关。


例子7-1是个有代表性的一眼就能看明白的例子。现实生活中的很多事情不像这样一目了然,但背后的道理是一样的。


2、量化购买产品先后距离的核心思想

我们现在用论文[②]中的实际数据,用线段的形式来抽象化表示例子 7-1 所代表的情景。线段的图示如图7-4所示:

图7-4 不同产品对应的需求成熟度位置

图7-4用Sj代表不同的产品(或服务)。本来可以Pj来对应不同的产品(product),但为了跟后续公式中的概率(probability,常缩写为P或Pr)符号明显区分开,这里用Sj来代表不同的产品。论文原文用的是银行的业务数据,S1~S8分别对应支票账户、储蓄账户、借记卡、信用卡、分期贷款、存款、基金、证券。我们也一样可以用S1~S8对应例子7-1中的婴儿床、婴儿尿布、奶粉、声响玩具、学步车……


我们从例子7-1能够感受到,现实世界中应该存在类似于图 7-4 这样的情况,即不同产品存在一个相对位置,产品之间的间隔也许不是等距离的。在最初阶段,我们只是把每个Sj(对应S1~S8)随意放在了图7-4线段上的某个位置。每个产品Sj最终的位置需要用数据拟合出来。


图7-4的线段长度意味着什么目前还不能确定,可能是时间,可能是购买次数,还可能是购买金额。也就是说,如果就按照每个Sj在图7-4中的位置,那么顾客从购买S2到购买S3所需经过的距离,超过了从购买S1到购买S2的距离,但这个距离代表什么还不知道。有可能从S1到S2要经过1个月,而从S2到S3要经过3个月。或者顾客购买S1(也许是婴儿床)1次后,就会购买S2(例如婴儿尿布),但需要购买3次尿布后才会购买S3(可能是奶粉)。我们能确定所有Sj都分布在图7-4线段上的某处,但目前确定不了具体的位置。


以一个顾客为例(这样就不需要用i来代表顾客,可以在使用符号时简化掉一个下标“i”),我们回想一下例子7-2,顾客坐在汽车上拿路边的东西。某个时刻t顾客有相应的需求成熟度(demand maturity,即DMt),当DMt越接近Sj所处的位置,购买的可能性越大。我们可以用DMt和Sj之间的距离来表示这种接近程度。我们在第二节已经知道有各种衡量距离的方法。这里就用简单的一维直线距离来衡量,即|DMt-Sj|。


量化购买产品先后距离是本节的重点。为了说明思路,目前就先假设该顾客是否购买某产品只跟|DMt-Sj|有关。我们用效用(utility,缩写为U)来简化代表|DMt-Sj|,即Ujt=|DMt-Sj|。其中Ujt代表时间t该顾客需求成熟度(就是例子 7-2中汽车的位置)和产品j之间的距离。那么按照式(7-5)表达的思想,当固定住时间t时,顾客购买产品j的概率如下所示:

顾客选择购买S1~S8中的哪个产品,不仅取决于顾客当前位置与该产品的距离,还取决于顾客与其他产品的距离。所以,式(7-7)的分母把顾客与每个产品的距离(即Uj)都考虑进去,因此才需要∑βjUj=β1U1+β2U2+…。按照这个思路,就能用式(7-7)计算出顾客购买产品Sj的概率,即Pr (S1)、Pr (S2)、Pr (S3)……如果顾客在时间t只购买一个产品,那么就会买Pr(Sj)最大的那个。


看起来我们已经把问题解决了。实际上,整个流程是我们先有一些已知的数据(顾客的特征、行为和顾客购买了什么产品),然后用这些数据拟合出βj和Uj(即|DMt-Sj|)。也就是说,我们还需要知道某个顾客的DMt和与顾客完全无关的Sj。有了这些以后,我们才能用式(7-7)去预测其他顾客购买产品j的概率。注意,为了突出重点和简化问题,在刚才分析的过程中,针对的是一个顾客在某一时间的情况,所以在式(7-7)中没有用到代表顾客的下标i和代表时间的下标t。


3、量化购买顺序之间距离的常用数据

量化购买顺序之间的距离并不需要什么特殊的数据,仍旧是用表 5-1、表7-6那样的数据。通常包括不随时间变化的静态信息(例如顾客的背景信息)、随时间变化的动态信息(例如顾客的行为)和行为结果信息(例如买了什么产品)。静态信息、动态信息具体包括什么,往往随着行业特点有所不同。本节引用的论文中,案例企业有经市场调查获得的信息(包括顾客在过去半年中是否注册有竞争对手的账户、对本企业的满意度如何),也有顾客的背景信息(例如教育程度和收入),还有顾客的行为信息(累计购买次数、在企业存储或者花费的金额以及与企业保持关系的时间长度)。这些数据看起来并没有什么特殊之处,但都可以用于解决预测问题。


以论文原文所用案例(银行业)为例,顾客购买某产品获得的效用Uj除了跟其需求成熟度与产品之间的距离有关外,还受到顾客对企业的满意度、顾客对竞争对手的了解程度和顾客的转换成本影响。因此,原文计算效用Uj采用了如下公式:

式(7-8)中,Uijt代表顾客i在第t期购买产品j可能获得的效用,DMi(t-1)表示上一期末(即第t-1期)的需求成熟度。为了避免误解,额外增加了一个括号,即(t-1)。COMPETi是个0-1变量,代表顾客是否在竞争对手那里注册有账号。SATi代表顾客对本企业的满意度评分。SWITit则代表顾客转向竞争对手那里的转换成本,原文是将教育和收入作为判断指标,认为教育程度高和收入高人群时间宝贵,转换的可能性下降。原文用的是0、1来对SWITit进行赋值。如果使用教育程度或收入高低的排序数据,则又可以与满意度评分一起考虑。


应用于其他行业时,可以认为构成效用Uj的主要因素是内因,即顾客本身的成熟度与产品的距离。除此之外,还存在其他的调节因素。例如,如果顾客对本企业不满意,则效用就会打折扣;如果顾客对竞争者更满意,会影响对本企业的满意度。顾客对竞争者满意的前提是顾客也在使用竞争者的服务(例如也注册有竞争者的用户账号或者也有下载竞争者的App)。竞争者促销信息等也会产生影响。根据行业经验能够判断哪些因素会影响效用,然后,主要取决于企业现在存有哪些数据,可以从数据入手考虑哪些因素会影响效用Uj。如果只看原文所用的变量,会让人感觉有些奇怪,但如果考虑数据的可获得性,就能明白为什么原文采用那些变量了。


式(7-8)中的SATi只跟顾客有关,与产品j无关。因为原文用的是一次性的调研数据,所以,也跟时间t无关。既然满意度SATi涉及企业而跟产品无关,从道理上我们也可以把这一项作为一个系数,合并到βi的位置。COMPETi和SWITit都是0-1变量,所以不能合并到βi的位置。


顾客的需求成熟度很难直接判断。原文使用间接预测的方法,即采用一些非直接的隐含指标来衡量。例如顾客使用产品次数多、在企业花费金额高(如在银行账户里存的钱多)和企业交往时间长等。这一方面代表顾客更加信任企业(跟企业交易的风险感降低),另一方面也隐含着顾客本身逐渐成熟。因此,原文用这些数据来计算顾客的需求成熟度DM。因为没有当期数据,所以用截至前一期末的数据,即DMi(t-1)。


DMi(t-1)无法直接观测到。我们可以回想例子7-2提到的人坐在行驶的汽车上的比喻,虽然无法直接观察到那个人目前到了哪里(即目前的需求成熟度DMit),但可以根据他之前到了哪里来做出判断。如果顾客买了某产品Sj,那么他的需求成熟度应该距离那个产品不远。所以,我们可以用顾客在前一期即第t-1期买过哪些产品来做出判断。因此,原文把顾客持有的银行产品都考虑了进去,计算一个累积的值。原文采用的计算公式如下所示:

式(7-9)等号右侧的Dij(t-1)是个0-1变量,代表用户i在第t-1期(即上一期)是否购买了产品j。如果没买,即Dij(t-1)=0,可以理解为上一期距离产品j很远;如果买了,即Dij(t-1)=1,则Dij(t-1)Sj=1×Sj=Sj

看起来虽然考虑了所有的产品,但其实只有买了的那个产品才对结果有影响,没买的产品Dij(t-1)Sj=0,则对结果没有影响。


不同顾客之间或者不同产品之间,顾客购买的次数、金额、与企业保持关系的时间长度并不相同。因此,式(7-9)又通过(λ1BNij(t-1)+λ2BALij(t-1)+λ3Dayij(t-1))把这些因素也考虑了进去。BNij(t-1)代表顾客i截至第t-1期一共购买了多少次产品j。BALij(t-1)代表顾客在产品j上的每月账户余额(原文研究的是银行业)。Dayij(t-1)则表示顾客从开户到目前持有产品j多少天。购买次数对所有行业都类似,账户余额可以用购买总金额替代,毕竟花的钱越多,顾客的决策风险越大,顾客对企业越信任。维持账户多少天则可以考虑为顾客和企业保持交易至今有多少天。三者综合起来,即考虑了购买次数、购买总金额和保持交易的总天数,这是所有行业都用得上的特点。实际上,我们不必拘泥于原文采用了哪些指标,而是要考虑哪些因素影响顾客的需求成熟度,同时再看企业存有哪些相关数据。为了避免不同变量的量纲不同导致的影响,例如购买10次,而账户余额可能是100万元,可以对所有数据采用归一化或者标准化处理。


4、先后距离思想的应用拓展

我们在本节中认为顾客先后购买的产品之间存在某种距离,该距离受到需求成熟度的影响。随着顾客需求成熟度的变化,外界可以观察到顾客购买的产品也在发生变化。实际上,顾客不仅在产品上存在需求成熟度,在其他领域也存在类似的成熟度。


企业运营不同渠道(可能是购买渠道或沟通渠道)的成本不同,顾客在不同渠道上的消费金额和贡献的利润也可能不同。例如,运营自助渠道(银行业的取款机、App或微信小程序)的成本低于人工渠道(实体店、网点、呼叫中心),企业因此常有把顾客迁移到自助渠道的动力。另外,企业如果认为顾客在线上购物的总金额高于线下店面,会同样希望把线下的顾客吸引或拓展到线上渠道。例如,线下的物美超市采用多点App把顾客拓展到线上,线下的盒马鲜生通过店面建立顾客信任,然后通过App把顾客吸引进盒马云超上。


虽然某些渠道确实从成本或利润上会优于另外一些渠道,但最终把顾客吸引到这些渠道并不意味着一开始向顾客推荐这些渠道就能成功。顾客的渠道偏好同样存在某种成熟度,例如信任成熟度或使用习惯成熟度。这都需要渠道迁移有一个先后顺序和过程。


其他事情也是同样的道理。例如,顾客要先用美团App骑n次共享单车,才会用它订餐;订餐m次后,才会用它买景点门票。或者,顾客会先用高德地图查询若干次路况后,才会用它来打车,又经过若干次打车,才会用它来订酒店。


本节为量化这种先后顺序之间的距离提供了一种思路和可用的模型。具体采用哪些数据,既取决于企业存储了哪些方面的数据,也取决于渠道成熟度方面的思想要考虑的影响因素。我们可以采用与产品成熟度类似的变量,但应根据渠道的特征进行适当的变通。


全文完结

欢迎诸位企业家朋友随时与朗玛峰团队沟通交流


【声明】内容源于网络
0
0
朗玛峰论坛
禀承 “ 科技、管理与资本相结合” 的理论,通过不断提供有价值的服务,用管理成就科技企业,帮助我们所投的企业成为中国科技力量的中流砥柱。
内容 265
粉丝 0
朗玛峰论坛 禀承 “ 科技、管理与资本相结合” 的理论,通过不断提供有价值的服务,用管理成就科技企业,帮助我们所投的企业成为中国科技力量的中流砥柱。
总阅读0
粉丝0
内容265