声音被描述为“我们灵魂的镜子”(Sundberg 1998)。我们能够根据他人的声音暗示,通过直接且看似毫不费力的参照过程,对他人的情感状态或特征形成印象(Juslin和Scherer,2005)。
音色、响度和音调(Timbre, loudness, and pitch)是人类声音的三个关键特征(Crystal 2011)。
声音亮度(vocal brightness):作为声音音色最显著的维度,也被称为锐度(sharpness),描述了声音中高频能量的量(Klapuri and Davy 2006; Von Bismarck 1974)。根据文献,明亮的声音通常与高唤醒、兴奋、外向和低情绪稳定性联系在一起(e.g., Laukka, Juslin, and Bresin 2005; Sievers et al. 2019)。
响度(Loudness):也称为声强(acoustic intensity),描述了说话者辐射并被听者感知到的声功率(Zraick等,2004)。响亮的声音传达出高度唤醒、自信、能力、自信和外向的信号(例如,Juslin和Laukka 2003;Kim,Wang和Ding 2021)。
亮度和响度都是塑造说话人印象和说服力的重要副语言线索(Jiang and Pell 2017; Scherer 1978)。然而,以前的研究主要集中在个人的声调(Chattopadhyay et al. 2003; Lowe and Haws 2017),而营销文献中很少关注人声的亮度和响度。
本研究旨在调查销售人员的声音亮度和响度对客户购买结果的影响。先前的研究表明,人们能够相当准确地从短暂接触非语言线索中识别他人的情绪(Ambady 和Rosenthal 1992)。在营销互动中,客户可以根据销售人员的声音提示快速判断他们的情感状态和特征(Juslin&Scherer 2005)。然而,销售人员的声音对客户购买决策的影响可能取决于特定的营销环境。例如,客户获取和保留在战术优先事项上是不同的,因此需要不同的营销策略(Reinartz&Thomas etc.2005 ;Voss&Voss 2008)。获取侧重于建立知名度和激发兴趣以吸引新客户,而保留则优先考虑提供卓越的服务和增值优势,以保持现有客户的参与度和满意度(Payne 和 Frow 2005)。从这个意义上说,副语言语音提示对购买行为的影响也可能取决于客户生命周期的阶段。
在本文中,我们在两种营销背景下(即客户获取和保留)回答了以下研究问题:(1) 销售人员的语气——特别是声音亮度和响度——如何影响新客户和现有客户的购买行为?(2)语音特征对新老客户购买行为的影响背后有哪些心理机制?
音高、音色和响度被认为是人声的三个关键特征(Crystal 2011)。虽然之前的研究已经检查了音高对产品感知和购买行为的影响(Chattopadhyay 等,2003; Lowe 和 Haws,2017; Peterson、Cannito 和 Brown,1995),但音色和响度在营销文献中很少受到关注,特别是关于它们作为销售人员和客户之间互动中有效沟通策略的潜力。据我们所知,没有任何营销文献关注销售人员声音的音色。
营销文献中与声音响度相关的唯一发现表明,响度变异性loudness variability(表明声音响度波动的程度)与销售业绩没有显着关系(Peterson、Cannito 和 Brown 1995)。因此,我们的工作是最早探索声音亮度和响度对客户购买决策影响的工作之一。
1、语音特征在客户获取中的说服力
新客户通常不知道公司的产品或服务——客户获取侧重于建立对公司产品的广泛认识和兴趣。与情感相关的刺激在客户获取中比保留更重要(Homburg、Koschate 和 Hoyer,2006)。因为当客户遇到新产品或服务时,没有信息可以从记忆中借鉴。新客户更有可能依靠与情感或情感相关的刺激来做出判断。
声音亮度指声音从“沉闷柔和”到“明亮尖锐”的特征(Von Bismarck, 1974)。明亮的声音包含更多高频谐波能量,听觉系统会将其解读为“兴奋”或“热情”(Pinheiro et al., 2021)。明亮的声音通常与高唤醒(high arousal)相关,代表能量充沛与兴奋,而非平静或放松(Bannister, Laukka, Scherer, Sievers 等)。高亮度的声音传达了高度唤醒的信号,在建立新客户的意识、激发好奇心以及使促销信息更具记忆力和影响力方面发挥着重要作用。
在新客户开发阶段,由于客户对产品/服务了解有限,唤醒型刺激(如亮声音)比其他类型的刺激对购买行为影响更大(Homburg et al., 2006)。因此,以明亮的声音传达的唤醒线索比其他线索更重要。因此,更明亮的声音可以通过更高的感知唤醒来增强新客户的购买行为。基于此,提出:
H1: 对于新客户,在其他条件相同的情况下,销售人员声音亮度越高,其对购买行为的影响越正向。
H2:对于新客户,销售人员的声音亮度与购买行为之间的关系是通过客户对销售人员唤醒的感知来解释的。
人声响度是指声功率,根据距扬声器指定距离处的声压级进行量化(Zraick等,2004)。许多高度唤醒的情绪,例如愤怒、兴奋和喜悦,通常与声音响度的增加相关(Bannister 2020)。
当客户的记忆中存储的产品知识很少时,与认知相关的线索相比,与唤醒相关的线索更有效地吸引新客户的兴趣并增强营销信息的影响力。因此,表示高度兴奋的大声声音可以迅速吸引潜在买家的初步兴趣并鼓励他们购买。更大的声音可以通过更高的感知唤醒来促进新客户的购买行为。基于此,提出:
H3:对于新客户来说,在其他条件相同的情况下,销售人员的声音响度对购买行为的影响是积极的。
H4:对于新客户来说,销售人员的声音响度与购买行为之间的关系可以通过客户对销售人员唤醒的感知来解释。
2、语音特征在客户保留中的说服力
现有客户已经获得了关于产品或服务的足够信息,他们通常会回忆起以前的使用经验,以帮助他们做出购买决定。在这种情况下,与唤醒相关的提示(例如,高唤醒的声音表达)对购买决策的影响降低,而与认知相关的提示的影响增加(Homburg,Koschate和Hoyer 2006)。而与认知相关的提示是触发客户理性思维的信号,例如基于销售人员能力的购买决策。能力指的是与感知的能力相关的特征,包括智力、自信和技能(Cuddy,Fiske和Glick,2008;Fiske,Cuddy,和Glick,2007)。文献表明,被认为有能力的销售人员倾向于引起对广告产品的积极态度。
在客户留存过程中,传递出胜任感觉的声音可以提醒现有客户他们愉快的先前使用体验,这会促使他们进行重新购买。因此,声音表达的信号传递能力起主导作用,并且比高唤醒程度的声音表达对现有顾客的重购行为产生更大的影响。
低亮度的声音通常被认为给人一种能干的印象(Zoghaib 2019)。声音的亮度与情绪稳定性呈负相关(Liu等,2020)。情绪稳定性和感知能力之间存在正相关关系(Barrick和Mont 2012;Bontempo和Napier 2011)。总之,低亮度的声音可以给听众带来一种胜任的感觉。考虑到现有客户对与能力相关的提示敏感,这些提示会提醒他们愉快的先前使用体验,低亮度的声音可以通过更高的感知能力来增强现有客户的再购买行为。基于此,提出:
H5:对于现有客户,在其他条件相同的情况下,销售人员的声音亮度对回购行为的影响是负面的。
H6:对于现有客户,销售人员的声音亮度与重购买行为之间的关系可以通过客户对销售人员能力的感知来解释。
响度:通常认为声音越大表明说话者的能力越强。Gélinas-Chebat、Chebat 和 Vaninsky (1996) 表明,声音的响度对来源的可信度产生积极影响。在他们的研究中,可信度被视为一个多维概念,包括专业知识、能力和专业知识等维度。Brown 和 Bradshaw(2018)认为,声音越大,其特征是自信,这与能力有关。
由于从响亮的声音中推断出的能力可以提醒现有客户他们的愉快使用体验,并强化他们对产品或服务的好印象,因此响度较高的声音可以通过更高的感知能力来鼓励现有客户的回购行为。因此,我们假设如下:
H7:对于现有客户,在其他条件相同的情况下,销售人员的声音响度对回购repurchase行为的影响是积极的。
H8:对于现有客户,销售人员的声音响度与回购行为之间的关系可以通过客户对销售人员能力的感知来解释。
在分析了绿色引导干预的总体影响后,作者接下来利用新颖的机器学习方法来探索重要的处理异质性。具体来说,本节展示了如何通过构建CML模型识别双重引导的显著处理异质性,并说明如何通过“智能”地仅对特定顾客实施引导来放大其对减少退货的总体效果。
研究一
1、数据来源
数据是与中国的一家主要提供面部护理服务的大型保健美容公司合作获得的。
公司介绍:该公司成立于2003年,经营着100多家直销店(被称为“皮肤管理中心”)。截至2021年,它拥有约2000名员工和超过15万注册客户。
公司运作:客户购买超过一定金额(约280美元)——注册为会员——将购买的金额存入会员卡。顾客光顾门店时,可以用会员卡里的钱购买服务。同时,他们也可以向会员卡中添加任何金额的钱(数据中平均为430美元)。对于三个月没有光顾商店的注册客户——销售人员联系——提供免费面部护理(价值72美元)来鼓励他们再次光顾商店。这项免费的面部护理将在一个月后到期。
数据集:包括每个客户的过去购买信息、会员详细信息、访问历史以及销售人员给客户打的所有电话的音频片段。它包含了销售人员在2019年5月15日至2019年12月31日期间为留住客户而拨打的8920个电话的音频片段。对话是在两个单独的频道上以8 kHz的采样率录制的。
2、变量测量
数据预处理。由于数据集同时包含销售人员和客户的声音,因此应用了机器学习方法来区分销售人员和客户的身份。
亮度和响度测量。采用openSMILE 工具处理音频。亮度表示声音“明亮度”或“尖锐程度”,其计算指标为谱质心(Spectral Centroid)。响度表示声音的“音量强度”,其计算指标为均方根能量(RMS Energy)。
回购测量。这项研究侧重于三种回购结果,这对于确定客户的价值至关重要(e.g., Ma et al. 2011; Scholdra et al. 2022)。客户接到电话后是否进行了回购(回购行为):二元变量,值为 1,表示客户在接到电话后 30 天内再次光顾商店并进行了购买(即进行面部护理或充值会员卡),否则为 0。回购的速度(回购时间):呼叫与呼叫接收者的购买时间之间的时间间隔(以天为单位)。花费了多少(回购量):客户在回购访问中充值的金额。
控制变量。模型中还包括一组与客户、销售人员和呼叫相关的控制变量。顾客层面控制变量:基于经典的RFM 框架(Recency, Frequency, Monetary value)来控制顾客差异。控制了客户成为会员的天数、购买频率、以前的支出、会员级别和客户性别。销售员声音特征控制变量:过滤后的听觉谱、转换后的听觉谱、听觉谱段特征、声音基频波动、振幅波动。通话层面控制变量:销售员内容情绪、销售员说话时长、顾客说话时长。
3、研究模型
为了估计销售人员的语音特征与客户复购行为之间的关系,我们建立了如下模型:
其中i对销售人员进行索引,j对客户进行索引,t对呼叫日期进行索引。Y指的是三种回购结果:回购行为、回购时机、回购量。αi是捕捉业务员i的时间不变特征的业务员固定效应(SalesPerson FE)。δt包括双向时间固定效应;它包括捕捉一段时间内回购趋势的每月固定效应(Monthly FE),以及捕捉打电话时潜在异质效应的星期固定效应(day-of-week FE)。CTRLSijt即与客户、销售人员和呼叫相关的控制变量的向量,如上一节所述。β1和β2测试销售人员声音的亮度和响度与回购行为之间的关系。回购行为(二元变量)采用 ReLogit 模型。回购时间采用生存分析(Cox 比例风险模型)。Cox模型不是直接预测“时间”,而是预测“风险率(hazard rate)”:在已经没有复购的客户中,某个时刻马上复购的概率有多大。Cox模型实际上在每一个时间点上都比较“还没复购的人”。它看谁的特征(比如声音亮度、响度)让他更早复购。回购量采用普通最小二乘法(OLS)。
3、结果
主要结果。模型2显示亮度与复购行为呈负相关,但响度呈正相关。模型4显示亮度会减慢客户的回购速度,但响度加速回购。模型 6 显示亮度和响度均对客户的回购量没有影响。先前的文献表明,控制购买量决策的心理机制与驱动购买选择和购买时机决策的心理机制不同。客户通常首先决定购买什么以及何时购买,然后决定购买多少单位(Wansink、Kent和Hoch 1998)。他们的购买选择和时机可能会受到情感或感觉相关线索的影响(Bellizzi和Hite 1992 年;Darke、Chattopadhyay 和 Ashworth 2006 年),而他们的购买量决策涉及更复杂的思维过程,主要依赖于消费需求、预算限制和存储要求等理性因素(Blattberg 等,1978)。因此,销售人员的语音功能对购买量影响不大。
客户情绪作为中间因变量。我们观察客户的真实购买行为之前,客户在营销互动中回复中表达的情绪也表明了他们的满意度和潜在的复购说服力(Ma and Dubé 2011)。为了捕捉这一点,我们分析了每个客户在通话期间回复的情绪(例如,Marinova、Singh 和 Singh 2018),并将其用作销售人员语音特征和客户复购行为之间的中间因变量。我们采用LIWC方法从文本中提取积极和消极情绪(Zeng et al. 2018)。根据客户在剩余通话中回复的文本,LIWC分析器检查每个单词,引用词典,解决词汇歧义等错误,并计算客户情绪得分,即文本中所有单词中积极词汇和消极词汇的百分比之间的差异。额外的分析表明,对于现有客户来说,低亮度和高响度的声音会引起更积极的客户情绪,从而促进他们的复购行为。
薄片判断(thin-slice judgment)。文献表明,人们可以在非常短暂的接触中对他人做出相当准确的判断,例如仅凭一段极短的音频片段(Ambady and Rosenthal, 1992)。为了检验在我们的研究情境中是否同样存在这种薄片判断机制,我们将每一次通话按照销售员与顾客的交互轮次(turn-taking)切分为多个“薄片”。每一个“轮次”由销售员的发言开始,并在适用时以顾客的回应结束。
逐轮动态情况(Turn-level dynamics)。基于销售员与顾客在通话中逐轮划分的数据,我们进一步分析了每通电话内部的动态变化。首先,我们评估了销售员在不同轮次中声音亮度和响度的跨轮次波动对顾客复购行为的影响。其次,我们考察了销售员与顾客声音特征之间的一致程度。具体而言,比较顾客上一轮说话的声音亮度/响度,与销售员下一轮的亮度/响度;计算两者差距,然后在通话内取平均。
语音适应性的实地研究。顾客事前的复购概率(a priori repurchase probability)可能会影响销售员声音的亮度和响度。在该研究中,销售员在每次拨打电话之前,被要求根据顾客的人口特征、会员信息和购买历史,估计每位顾客的复购概率。在完成估计后,销售员像往常一样拨打电话。结果显示,两组之间的声音特征没有显著差异。
内生性问题。工具变量(IV)分析:对于亮度,我们使用(1)呼叫时间是否在午休/下班前一小时内(下班前),(2)呼叫日期是否在每月发薪日之后的一周内(发薪后)。对于响度,我们使用(1)打电话的时间是在销售人员下午休息的时候还是在下班前的最后一个小时(能量低谷),以及(2)电话是否在销售人员刚刚休息了很长时间之后(长时间休息后)。基于两组工具变量,仍然得到了与主分析一致的结果。CEM方法:采用粗化精确匹配(CEM)方法构建了新的样本,使高亮度(或高响度)组与低亮度(或低响度)组的客户在除所接触的声音特征外的所有特征上都匹配一致。基于这两个匹配样本重新估计了 ReLogit 模型和 OLS 模型。结果同样与主分析一致。
控制客户的语音特征和语音线索。为了进一步确保我们研究结果的有效性,研究将客户的语音特征、语音特征的变异性以及语言线索作为控制变量加入模型估计中。
排除未付款的客户。现有的客户回购行为衡量标准可能包括客户在不支付任何额外费用的情况下再次光顾进行面部护理的情况。为了测试我们研究结果的稳健性,我们将复购重新定义为客户充值会员卡的情况,并通过排除未充值而返回的客户来重组分析样本。
替代计量经济学模型。客户回购行为:Firth Logit回归、常规Logit回归,以及常规Probit回归。回购时间:除了主分析使用的Cox比例风险模型之外,研究还采用了OLS回归、AFTaccelerated failure time模型和Cure模型。
敏感性分析。复购观察窗口:将复购观察窗口从30天扩展至60天或90天。使用不同的子样本重新估计模型:随机抽取80%与90%的样本重新估计模型,为确保通话具有有效沟通内容,我们排除了通话时长较短的样本。具体而言,我们删除了通话时长位于样本最短20%或10%的通话,分别保留80%或90%的样本进行分析。非线性效应:在模型中加入了语音亮度与响度的平方项。
研究二
1、实验设计
研究 2 采用 2(亮度)× 2(响度)× 2(客户类型:现有客户vs新客户)的受试者间设计。在招聘广告中,该研究被介绍为一项专注于评估客户对在线插花课程的态度的研究。参与者被告知该研究包括两个阶段:注册阶段和调查阶段(三天后)。
2、实验流程
报名阶段:参加者首先说明(1)有否插花经验及(2)有否修读过任何与插花相关的课程,以确保符合条件。只有对这两个问题都回答“否”的参与者才能继续完成注册。
参与者被随机分配到两种客户类型条件之一(新客户与现有客户):新客户条件的参与者被告知他们已经完成注册,并将收到一个调查链接,以便在三天内参加研究的第二阶段。现有客户条件下的参与者被指示阅读在线插花课程的介绍。然后,他们被要求通过观看有关如何制作便携式花篮的三分钟视频来体验课程。在体验了在线插花课程后,现有客户条件的参与者被告知在三天内参加第二阶段的研究。
三天后,完成注册阶段的参与者将收到一个调查链接,以参与研究的第二阶段。在此阶段,我们将参与者随机分配到四个条件之一(亮度:高与低×响度:高与低)。新客户条件:想象自己接到销售员电话,推销一门线上花艺课程。然后,他们聆听了为新客户准备的四个音频剪辑之一。现有客户条件:想象接到电话,推销他们在注册阶段已体验过的线上花艺课程。然后,他们聆听了为现有客户准备的四个音频剪辑之一。
音频材料:一位女性研究助理,她不知道我们的研究假设,录制两个音频音调。这些音频片段是关于一个在线插花课程平台最近为新老客户进行的促销活动。在音频片段中,参与者被告知,一个在线教育平台正在为新(现有)客户提供由 18 节课组成的插花课程的促销活动。如果他们购买任意数量的课程,他们可以享受 50% 的折扣。两个音频音高的内容和长度完全相同,只是“新”一词被替换为“现有”。鉴于说话者是女性,高低光谱质心值以及 RMS 能量值来自一个由从社交媒体平台收集的女性视频组成的数据集。根据高于和低于均值一个标准差的准则,在高低亮度条件下将光谱质心值(亮度)设置为1,950和950,在高和低响度条件下将RMS能量值(响度)设置为.50和.20。这些值落在研究 1 中使用的电话交谈中实际销售人员的声音中观察到的光谱质心和 RMS 能量值范围内。
听完音频片段后,所有条件下的参与者都表示了购买在线插花课程的意向、计划购买时间和计划购买量(即课程数量)等信息。
3、结果
结果显示,新客户在高亮度条件下的购买意愿高于低亮度条件,新客户在高响度条件下的购买意愿也高于低响度条件,感知唤醒在其中起到中介作用。相比之下,现有客户在高亮度条件下的购买意愿低于低亮度条件,而在高响度条件下,现有客户的购买意愿高于低响度条件,感知能力在其中起到中介作用。
理论意义:首先,本研究拓展了非语言沟通(nonverbal communication)的研究范畴。其次,本研究为客户关系管理(CRM)领域提供了新的理论视角。最后,本研究基于心理学与声学领域的理论(如 Juslin & Laukka, 2003),揭示了销售人员声音特征与顾客感知之间的心理机制。
实践启示:本研究为管理者和销售人员提供了可操作的指导,说明如何通过调整声音特征来更有效地获取新客户和维护老客户。在具体实施方面,销售人员可通过短期声学训练或AI语音调节技术调整声音亮度与响度。亮度可通过改变声道形状和共鸣方式来实现,响度则可通过控制气流强度与发声力度进行调节。此外,现代音频软件与AI语音生成工具(如 Ableton、MorphVOX 或 Murf 等)也能实现实时语音优化,使普通销售人员在较短时间内掌握声音控制技巧。
研究结果表明,即便是微小的声音调整也能显著提升销售绩效。例如,亮度略微下降可增加复购概率,响度略微提升也能提高购买可能性。然而,过度明亮或过于响亮的声音可能产生反效果,因此企业应持续监测关键指标(如新客户转化率、复购率、购买时机等),并结合客户反馈动态优化声音策略。
总体而言,相较于投入大量广告预算,通过科学调整销售人员的声音特征是一种低成本且高回报的客户关系管理策略。虽然本研究基于电话营销情境,但所揭示的唤醒与能力信号机制同样适用于其他情境,如门店销售、广告传播及服务机器人互动等。


