
文 | 吾来项目开发团队
前言
语音机器人是具有自动拨打电话、接听电话、多轮语音交互、智能意向判断等多种功能的智能对话机器人。语音机器人可以快速挖掘潜在用户,及时解决用户问题,进而提高服务质量和服务效率,在房地产、金融、教育、银行、保险、电商等行业广泛应用。机器人相对于人工坐席,具有成本低、效率高、工作态度稳定,数据记录全面等优势,具体对比如下:

搭建语音机器人方案
下面我们将从工作流、系统设计与吾来机器人搭建三部分介绍如何利用吾来平台搭建智能语音机器人。

通讯管理模块:SIP Server包括FreeSWITCH[1]电话系统和通信线路,使用SIP Trunk技术,负责语音/按键流的输入输出,以及转人工参数传递等。
语音模块:负责语音相关的操作,包括语音识别(ASR)、语音合成(TTS)、端点检测(VAD)以及录音播放等,通过HTTP接口形式和其他模块通信。
中控模块:中控模块是语音呼叫系统的集成模块,负责和其他系统及模块对接,打通和控制整个呼叫流程。主要任务是将ASR识别结果传入对话机器人,并将机器人返回的指令,转换成电话系统控制指令,实现放音、转人工、挂机等流程的控制。
存储模块:负责将和通话相关的必要信息存储到数据库,方便后续的质检工作。
防骚扰模块:负责中控模块话单的拨打控制,通过一定的防骚扰策略设置,避免对同一号码的反复拨打。
CRM模块:工单模块负责工单任务的创建和业务的处理,也可以查看话单拨打结果、查询通话录音、人工回拨等业务操作。
机器人管理模块:机器人模块是系统解决方案中的AI赋能系统,包括基于业务流程的任务机器人,和基于知识库的问答机器人。

-
业务人员通过CRM模块上传呼叫话单,并对话单加密,保护用户隐私信息; -
中控模块通过防骚扰模块过滤话单号码,并为通过验证的号码创建自动呼叫任务; -
外呼模块拉取话单,为下一步进入拨打流程做好准备。
-
外呼模块通过线路开始拨打用户电话; -
待电话接通后,开始一个语音/动作处理的循环流程。呼叫模块(通讯管理模块,语音模块)将SIP流语音信息/用户动作识别为文本信息/用户动作事件,并将这些信息推送到中控模块; -
中控模块将ASR识别结果传入吾来平台,并将任务机器人返回的指令,转换成电话系统控制指令; -
外呼模块负责实现放音、转人工等流程的控制。之后再开启一个语音/动作处理流程; -
待用户主动挂机,或吾来平台控制挂机后,中控模块收集用户挂机报告、用户录音文件报告等信息进行数据存储,以备后续查询。

用户通过线路开始拨打电话;
待电话接通后,开始一个语音/动作处理的循环流程。内呼模块将SIP流语音信息/用户动作识别为文本信息/用户动作事件,并将这些信息推送到中控模块;
中控模块收到通话文本信息后,中转通话信息到吾来平台;
吾来平台进行意图识别(NLP),再根据机器人流程进行对话控制,并返回回复给到中控模块。此过程也会调用CRM模块自动创建工单,用于后续业务的处理;
中控模块根据协议内容响应呼入模块;
呼入模块根据回复内容播放相应的录音文件,或者进行语音合成并播放,或者进行转人工等操作;
待用户主动挂机,或吾来平台控制挂机后,呼入模块发送用户挂机报告、用户录音文件报告等信息,中控模块进行数据存储,以备后续查询。
1) 触发任务
2) 会话流程
静默:静默指在等待用户动作时,用户没有按键、说话等其他可以被归纳或识别的动作,也可以称之为静音/用户不回答/无应答。
拒绝:明确拒绝,明确拒绝所介绍的产品或服务,一般常见于外呼场景,例如:不需要、不考虑、没有打算、不感兴趣等。
否定:对AI说的话的否定,如您之前预约过我们公司的课程是吧?用户如果回答不知道,并不是拒绝AI介绍的产品或服务,而是对AI某些问答的否定。
肯定:用户希望向下一步或者判定可以继续向下走,类似同意、可以、登记等。
自定义的业务选项:如您想办理什么业务呢?代收快递、门卫放行等自定义意图。
未识别:也可称之为拒识,一般还要分为两个层级,不在当轮任务中所列选项,或者调用问答知识库之后仍没能召回知识点。
任意回复:也称作任何回复
其他特殊反应:如未听清、再说一遍(重说)、信号不好、你是谁、哪里的、干嘛的、什么事等。
-
根据用户意图进入任务流程:基于历史的咨询语料以及内外呼热点问题, 总结出一些业务流程,机器人通过多轮对话的方式和用户进行交互,帮用户完成任务。用户语音回复话术,机器人基于NLU识别出用户的意图,如肯定,否认,拒绝服务,在忙,提问等,语音呼叫模块识别语音/动作后,通过中控发送给机器人,并跳转到下一步任务。
-
任务流程切换:意图的切换与保持,允许在一个流程未完成的情况下,切换到另一个任务中。切换后,原任务的对话流程可以保持一段时间。新任务流程结束后,机器人可主动切回原任务流程,例如客服来进入电确认试听课时间流程,在用户回复过程中触发了咨询老师课程安排流程,当前流程结束后仍可以继续上一个未完成流程(确认试听课时间流程)。

任务与问答流程切换:允许在一个流程未完成的情况下,切换到问答机器人,当流程结束后,通过按键切换到该流程。问答机器人,当用户问一个新问题时,需要做就是从知识库里找到对应的知识点,把答案回复给用户。知识库是能够回答关于某个领域的一些常见问题,知识库里包含若干个常见问题及相似问法,以及对应的答案。

用户属性组回复不同话术:吾来平台允许机器人根据不同的身份(属性)回复有针对性的话术与推荐,如下例子:可以根据业主电话与陌生电话,回复不同的选项,提升沟通效率。

将语音返回用户:中控获得机器人回复后,将系统动作转变成自然语言文本,并将文本转语音或者录音文件名传给语音呼叫模块,语音呼叫模块进行相应的放音操作。
-
挂断:在以下三种情况下,会进行挂断操作,待用户主动挂机,或吾来平台控制挂机后,内呼/外呼模块发送用户挂机报告、用户录音等信息。 1)当机器人完成用户的任务后,用户可以通过按键来结束挂机。 2)当机器人多次询问用户,用户有两次静默后,机器人会主动挂机。 3)当用户可能会在中途随时选择挂机。
数据存储:在有些项目上,需要记录用户的标签,用户对应轮次的回复,走过的轮数,对用户进行打标(这种记录通常被称作“埋点”),埋点通常在各个流程之后以词槽记录的形式留下来,比如:用户经过第一轮的时候,用户轮次变为走过第一轮;用户提到价格时候,通过隐藏单元拿到用户说了价格,然后记录下来用户说了价格这件事;另外还有基本的对每一轮用户反应的判断最后如何影响最终的结果。最后,将信息存到表里即可。
单字的处理
打断的处理
通话信息的收集

特殊情况的处理

1) 用历史语料训练ASR 并提升语音识别的准确率
2) 丰富相似问,训练模型来提高准确率
3)针对语音场景,增加容错机制
4)优化话术,提高成功率
内呼,需增加亲和力,具有服务意识。
外呼,在话术中帮用户预置选择——多给用户选择题,而不是填空题。
同时,适当挽回话术可以继续引导用户向下进行。
结语






