
1952年,贝尔研究所(又称:Bell实验室)成功建立了世界上第一个「语音识别系统」,该系统能够识别9个英文数字的发音,宣告了语音交互时代的到来。
而伴随计算机、互联网+、大数据及人工智能等技术的崛起,语音识别已不再局限于语音采集识别、信息实时录入等传统能力,而是向更为深度的「人机智能交互」领域发展。

从移动终端设备的尝试,到智能音箱的普及,如今的人们或许早已习惯了与AI进行对话,并借此帮助自己进行一些信息的网络搜索或者执行其它的指令。同时,越来越多智能家电的网络端接入,也让这样的语音指令产生出更多的服务场景,进一步推动了语音交互的发展。
另一边,作为车内人机交互的第一选择方式,车载语音交互也同样是行业力争突破开发的焦点。更何况在智能座舱时代,除了中控、仪表、后座娱乐的屏幕硬件升级外,人与座舱的信息交互变得更为重要。

语音交互在不同产品中的运用场景存在差异,因此在技术实现上也有所区别。首先是声场环境不同,比如手机助手是近场识别,音箱和车则是需要远场识别。其次是对话领域的不同,智能家电主要是设备的调节,车除了控制车内设备外,更多的时候还要调用音乐和导航功能。
虽然存在差异,但语音交互的整体逻辑相类似:前端信号识别处理——后端语音识别将声音转化成输入的文本——通过语义理解解析出指令和关键信息——通过对话管理上下文——产生系统动作进行响应——语音合成生成音频回复用户。
作为行业车载语音研发优势企业,斑马智行基于达摩院先进的语音识别、合成、对话理解等语音技术,以及天猫精灵强大的语音交互能力、AI服务能力和生态资源,提供了整套解决方案。能力涵盖自主学习能力、自动识别方言交互、独家融合天猫精灵服务生态、智能座舱全景交互、全时全双工语视融合及开放合作模式。

同时,为实现灵活的产品集成模式,斑马智行还为客户提供了一套天猫精灵车载语音助手的接入方案。这套解决方案提供涵盖「车载APP一体化方案」及「语音服务模块化方案」两种接入方式。用户在车机端可通过“天猫精灵”的唤醒词进行指令操作。


车载APP一体化方案
提供车载APP整体输出,适用于搭载Android系统的车机,保障与天猫精灵原生音箱一致的体验。
方案特点
便捷接入:利用Android标准API,无需投入大量开发资源。
安全可靠:内置阿里巴巴安全中间件,保障应用数据安全。
极致体验:提供多场景智能应用,极致APP性能优化。

语音服务模块化方案
输出标准接口或SDK,适用于Android/Linux/QNX等多种系统,可自定义应用UI与交互。
方案特点
接入方式多样:提供标准API,支持端云、云云对接。
展现形态灵活:完全开放屏显能力,由客户决定应用形态。
兼容AVS:方便已接入Alexa的客户快速切换。

车载天猫精灵语音助手集成了车载信息娱乐与服务,实现内容一体:联合天猫精灵Skills和开发者,拥有千万级的内容库,涵盖儿童、女性、成年、老年各群体;本体生活一体:打通线上线下零售和服务生态,涵盖出行、订票、超市、电影休闲等各式体验。除此之外,车载天猫精精灵语音助手还能实现5200+实用AI技能,借助语音、触屏等交互方式,提供如健康助手、娱乐助手、智能家居助手等诸多功能。

车内语音购-淘宝、天猫
不仅如此,车载天猫精灵语音助手还可提供与AIoT设备等链接,将“人-车-家”的应用场景深度串联。基于天猫精灵所取得的丰富的设备连接协议,用户可在车内通过天猫精灵语音助手进行居家智能设备的查询/控制,与儿童手表等IoT设备联动;在家亦可查询/控制车辆状态,发送目的地信息到车上。目前,天猫精灵可连接超3.55亿智能设备,是实现车家互联体验的第一选择。
目前,斑马智行车载语音助手已合作上市超300万辆车(截至2021年底),主流豪华品牌均已实现了合作。未来,斑马智行车载语音助手将持续增强自然交互能力、生活服务能力,拓宽家车互联场景,为更多用户带来人机交互新体验。


