大数跨境

一篇文章讲透语音降噪技术

一篇文章讲透语音降噪技术 声学楼论坛
2026-03-25
1
        本文内容节选:《汽车智能语音技术与体验》技术篇01章节,内容与书籍略有出入。 
        语音降噪技术是汽车语音交互的基础,但是因为它不带有显性的特性而常常被人忽略。
        汽车的语音降噪,它的核心目标是为了获得纯净且高质量的音频。
        汽车环境与家庭环境有所不同,汽车是一个动态的环境。首先就要提到汽车本身面临的是一个非常恶劣的噪声环境。首先,车辆在运行过程中会产生很多噪声,比如发动机的噪声,以及空调出风口的声音。车内还会播放音乐,导航甚至语音播报等声音。其次,汽车是一个载体,在密闭空间内会承载多人,有时甚至会有宠物,小孩在车内走动等。因此,车内天生是一个密闭狭小的空间,形成了多人的复杂声音场景。除了车内的噪声环境,使用车辆过程中还会有开窗等行为,使得环境变得复杂。当车辆车窗打开时,外面的风会进来,不同车速对风噪的影响也不同。行车过程中,我们会遇到迎面驶来的车辆,这些车辆的声音会形成明显的噪声。有时还会遇到大货车紧急的轰鸣声或鸣笛声,这是车外的环境音量。此外,遇到大暴雨时,雨刮器的声音也是噪声源之一。
        因此,从车辆本身到车内外的声音,都是一个复杂且恶劣的高噪声环境。噪声主要分为两类,稳态噪声和非稳态噪声。
为方便阅读,汽车语音降噪技术概览如下;
        稳态噪声如发动机和空调的声音,以及高速行驶时的稳定噪声。稳态噪声相对容易消除,而非稳态噪声则需要更复杂的降噪算法来消除。特别是多人干扰、鸣笛声等,需要长期的工程标定和积累才能有效消除。降噪的第二部分是我们的基础麦克风。
        在汽车语音最初应用时,我们尝试使用单麦克风进行语音降噪。经过一段时间的试验,发现效果不佳。这就类似于人只有一个耳朵时,无法区分声音的方向和先后顺序,导致声音相互干扰。
        后来发展出了车内多麦克风多音区方案,如两个麦克风两个音区分别位于左右,四个麦克风覆盖前后左右,甚至扩展到六个麦克风的方案。通过这个多麦克风的方案之后,实现了车内的分区。基于声音到达两个麦克风的时间差和相位差,可以判定并识别出声音的方位。根据声音方位,我们通过区域锁定来对噪声进行隔离。现在,部分高档车型还在搭载这个麦克风阵列。
        麦克风阵列本质上还是通过提升声音收音质量,实现对更复杂噪声场景的覆盖。我们的方案中,第一个是回声消除。在车上进行语音降噪时,座舱会发出多种声音,如音乐、导航提示音和语音播报声。我们将这些声音作为参考信号传入语音系统,从而抵消座舱内发出的声音。
        第二个是噪声抑制,即针对开篇提到的稳态和非稳态噪声,通过降噪算法进行抑制和消除,使音频变得更加纯净。第三个是基于声源定位和波束成型技术,可以相对隔离车内各个音区的噪声。
        第二个是通过波束成型技术,可以相对精准地锁定发言人的位置,实现对声音的定向收听,并获得更纯净的音频。
        除了获得纯净的音频,我们还可以提升音频质量,虽然这涉及到物理结构上的改变。车内的多麦克风和麦克风阵列可以提升音频质量。另一个方法是提升采样率,同样可以提升音频质量。目前行业普遍使用16K采样率,但从理论和物理角度看,将声音采样率提升到32K也能提升音频质量。
        尽管16K采样率在听感上似乎没有差别,但实际上随着采样率的增加,能获得更多的音频特征,意味着可以提供更高质量的音频。过去推崇16K采样率,更多是基于工程、成本和带宽的均衡考虑,并非为了最优体验。
《汽车智能语音技术与体验》目录
作者:肖建辉

技术篇:语音交互核心技术

一、语音降噪技术

    二、语音唤醒技术

      三、语音端点检测

        四、语音识别技术

          五、自然语言理解技术

          六、语音合成技术

            七、可见可说

              八、声纹识别技术

                九、大模型技术

                  产品篇:语音交互系统代际

                  一、智能座舱交互演进趋势

                  二、语音系统技术链路代际

                    三、语音产品体验代际

                      四、语音产品版本

                        设计篇:语音交互产品设计

                        一、语音助手核心体验设计

                          二、语音助手的框架设计

                            三、语音对话详细设计

                              案例篇:语音交互体验标杆

                              一、极致语音之路

                              二、飞鱼 OS2.0

                              三、蔚来 NOMI

                                四、小鹏小 P

                                  五、威马小威

                                  六、鸿蒙小艺

                                  七、理想同学

                                    八、500 天,语音体验引领

                                    测评篇:语音交互测评体系

                                    一、 语音测评规范概览

                                    二、语音关键指标测评

                                      三、语音测评实操指引

                                        四、行业标杆语音指标参考


                                        内容来源:肖工讲AI

                                        微信转载文章出于非商业性的教育和科研目的,并不意味着支持其观点或证实其内容的真实性。版权归原作者所有,如转载稿涉及版权等问题,请立即联系我们!



                                        【声明】内容源于网络
                                        0
                                        0
                                        声学楼论坛
                                        “声学楼”创办于2005年,致力于促进声学领域技术交流与应用。历经多年发展,声学楼已从一个单纯声学工程师交流平台,成长为音频企业上下游多方参与音频技术专业论坛之一,每年还通过举办技术研讨会、年会等活动,搭建起与会的行业供需双方沟通的桥梁。
                                        内容 0
                                        粉丝 0
                                        声学楼论坛 “声学楼”创办于2005年,致力于促进声学领域技术交流与应用。历经多年发展,声学楼已从一个单纯声学工程师交流平台,成长为音频企业上下游多方参与音频技术专业论坛之一,每年还通过举办技术研讨会、年会等活动,搭建起与会的行业供需双方沟通的桥梁。
                                        总阅读0
                                        粉丝0
                                        内容0