大数跨境

哈曼曲线-(上)

哈曼曲线-(上) 声学楼论坛
2026-01-04
2



第1部分

第一部分将首先解释人类听力的基本、共同的原则,所有这些方法都源于此。

哈曼曲线是什么?

哈曼目标曲线有几种变体,主要是由于听众偏好(在限制范围内)以及不同格式(例如,环耳式与耳内监视器)之间的密封差异

该曲线以音频设备制造商哈曼命名,其大多数主要研究人员都隶属于该公司,在InnerFidelity的耳机大师Tyll Hertsens(现已退休)发表了一篇综合专题文章后,该曲线成为焦点,总结了关于该主题的关键论文。

哈曼曲线本质上是一对“好”耳机在用专业设备测量时应该表现出的目标频率响应。

事实上,曲线是个性化和某种大众吸引力概念之间的谨慎平衡,基于支撑两股研究的相同心理声学原则。但这种平衡是如何实现的,为什么会实现,它妥协了什么,与什么协同作用?

解决这些问题需要看看哈曼曲线,这是漫长的(但有价值的)。它补充了解释哈曼曲线是什么的伟大文章——对广义可理解的调性的粗略近似,忽略了空间音频的精确个性化和精确的调度(这是相互关联的问题)。

概述人类的声音定位

理解哈曼曲线的第一步是了解频率响应(这就是哈曼曲线作为目标)和人类声音定位之间的关系。

相关:我们如何听?人类听力机制的解释

为了简单起见,以下是摘要。有四种类型的线索主导了定向定位:

  1. 头部相关转移功能(HRTF)
  2. 耳间时差(ITD)
  3. 耳间相位差(IPD)
  4. 耳间水平差异(ILD)

每只耳朵都有自己的HRTF

每只耳朵都有自己的头部相关传递功能(HRTF):随着来自自由场源的声音从它们身上反弹,我们的肩膀、軀干、头部和耳朵(包括外部耳廓和内腔)累积贡献的外部声源的频率响应变化。

当方向发生变化时,HRTF也会发生变化

HRTF随着方向的变化而变化。当改变的声音击中我们的鼓膜时,我们将这些变化映射到大脑的特定方向。我们已经适应了这些变化。

耳内(两只耳朵之间)线索有助于HRTF线索。由于两个耳朵被头部隔开,由于与源的距离不同,声音到达的时间存在差异,再加上声音“包裹”头部的不同方式,这取决于源声音激发的频率。因此,音量水平也有差异。

在1千赫及以上时,ILD比ITD更占主导地位

线索变得占主导地位的权衡点目前估计约为1千赫,ITD线索随着高频的放置而变得不那么一致和精确。这是因为1kHz时相应的波长约为17-18厘米,这是人头的大致直径。

随着频率越来越高,相对于头部的波长越来越小,它们更不能够“包裹”它,从而产生了显著的水平差异。因此,ILD在1kHz左右成为更主要的线索,而ITD则因其相对不稳定而较少。从本质上讲,我们还通过每只耳朵之间响度、相位和时机的差异来三角调节声音。

广泛的HRTF功能可以预测粗略的趋势

尽管头部形态存在明显的差异,但有一些广泛的HRTF特征,使我们能够确定粗糙的趋势。这个概念对哈曼曲线至关重要。

在某些频率下,耳道和耳廓通道的声音会放大。共振发生在耳道,耳道接近一个管子,里面有一个空气柱。某些频率的声音比其他频率更刺激这列空气。


例如,高水平耳道共振始终出现在3kHz左右,尽管精确的中心频率、强度和Q(共振的“锐度”或“狭窄”的技术术语)以及共振的形状可能有所不同。这是HRTF最具特色的特征之一

频域精度是空间听力的必要但不足的组件

音调和空间是相关的,但不是同义词。无论如何,准确空间再现的先决条件是频率响应的个性化,以补偿当声音击中鼓膜时,HRTF引起的变化中的个体差异。

如果HRTF不匹配,会发生什么?

不匹配的HRTF在主观上需要什么?发烧友唱片公司Chesky Records发行了一张由歌手兼词曲作者Amber Rubarth(《Sessions from the 17th Ward》)的一张非常受人听的专辑。其中一首歌是《巴黎的满月》。

这位作者听到了录音中广受赞誉的空间性,就像一团模糊的声音从他的头表面飞进飞出。尽管录音是使用双耳假人头制作的,这应该会产生合理的耳间线索,但声音感觉就像一个模糊的光环,紧紧抓住他的头皮。

然而,即使使用高性能的Stax扬声器设置,耳机的正面外部定位也严重不足。

作者用这个Stax耳机组合来测试Chesky Records的发烧友录音结果

前哈曼首席科学家(与哈曼曲线研究项目无关),现在是独立研究员,他给出了以下解释:

双耳演示通常很有效——特别是对于头部侧面或后部的声音。方位提示来自两只耳朵之间的时间延迟,即使音色严重不正确,头部的头部阴影也很有效。当声源快速移动时,如果与预期轨迹相冲突,大脑往往会忽略不正确的海拔提示。

如果视觉线索同时存在,它几乎总是会主导听觉线索。有一些良好的表演技巧和一个愿意被说服的主体,这些演示可以相当令人信服。但在怀疑倾听下,很少实现固定来源的正面定位。

然而,对于这位作者的经历来说,即使是解释似乎也太慈善了。这可能是因为这位作者是东亚裔,他的形态差异很大,以至于HRTF与使用的假人头的HRTF相比,高加索听众甚至更明显地差异。

据其领先供应商GRAS称,这是一个行业标准的头部和躯干模拟器,是一种专门的设备,旨在实现“与普通人相同的声学特性,包括独特的面部特征”。头部可以单独提供给躯干

这意味着没有实现声音的正面外在化,更不用说声源的精确正面定位了。值得庆幸的是,已经完成了工作,以提出一个标准化的假人头,它与东亚人头部形态的广泛趋势更相似,这有望在一定程度上缩小差距。

中国研究人员确定了东亚人,特别是华裔人的面部特征和结构的独特子集。这是BHead210,由此产生的假人头。它与上面图片中的GRAS明显不同
足够好的HRTF也可以适应足够的曝光、训练和互补的视觉刺激——类似于适应反转我们通常看到的图像的眼镜。


森海塞尔如何获得广受好评的“音响舞台”

森海塞尔HD800及其S变体的倾斜耳机驱动器产生了更逼真的HRTF,类似于来自正面的声音。它还为HRTF校正和其他校正技术提供了基础,因为非角度驱动生成的HRTF无法轻易校正

耳机设计也有助于部分解决此问题。森海塞尔HD800(S)是这种方法的主要代表。其广受赞誉的“声场”大部分都可以归因于有角度的司机。角度驱动器会导致生成一个近似的HRTF,它更像正面HRTF,而不是由未经校正的耳机播放生成的垂直于耳朵的横向HRTF。

这张图表描述了HRTF如何在30度(像立体声扬声器一样倾斜)到90度(像耳机一样垂直)之间变化

HRTF有多大的差异?

最上角的曲线是从立体声扬声器的右声道放置的右耳测量的HRTF(以及从这种源的左耳测量的)。

第二个自下曲线是从垂直于它的源(如非角度的耳机驱动器)在右耳测量的。垂直源的HRTF缺口更宽、更深,范围从8到10kHz,大约20dB。

30度的测量反映了扬声器或耳机驱动器将如何感知以这种方式倾斜,其缺口要窄得多(范围为8至9kHz)。尽管缺口差不多深,但曲线的整体趋势比垂直情况要平滑得多。

根据研究人员的说法,他的实验还表明,没有角度驱动器的耳机(从而产生这种垂直的HRTF)会产生不自然的声音,使进一步校正变得不可能。这是因为垂直的声源以特定方式与耳朵相互作用,产生更可听的HRTF响应(如上所示),但“无法均衡”。

频率响应中的缺口通常无法均衡,因为它们是由多个声音信号相互抵消造成的。提升缺口只会提升两个相互抵消的信号。虽然其他角度的HRTF会有所不同,但正面角度的缺口显然要少得多。

无论如何,由于辐射波阵面对整个耳廓的相对不自然的“照明”(因此对HRTF的保真度较低,HRTF会产生自然的正面声景),耳机播放(尤其是立体声录音,但即使是双耳)本质上也会受到损害。。

这就是RTing的PRTF测量所测量的——耳廓区域的完整、均匀的照明,就像它来自自由场一样。与扬声器相比,即使是HD800(S)也远非完美。扬声器在自由场中的波前允许完全的耳廓照明(相对于扬声器辐射基本均匀的区域,耳廓扩散的区域较小)。

另一个部分克服不匹配的HRTF的更复杂的方法是使用动态线索,用头部运动改变不匹配的HRTF(通过Kinect等运动跟踪技术跟踪听众的头部)。然而,相对于主体耳朵的音调不准确的根本问题仍然被保留下来。

总结一下:

“如果声音再现系统可以在听众的耳膜上产生与真实声源产生的声压相同的声压,那么听众应该无法分辨出虚拟图像和真实声源之间的区别。”

结论

Headphones make better speakers than speakers; speakers make better headphones than headphones.

内容来源:YD电声设计(未完待续)

 声明:本微信转载文章出于非商业性的教育和科研目的,并不意味着支持其观点或证实其内容的真实性。版权归原作者所有,如转载稿涉及版权等问题,请立即联系我们!



【声明】内容源于网络
0
0
声学楼论坛
“声学楼”创办于2005年,致力于促进声学领域技术交流与应用。历经多年发展,声学楼已从一个单纯声学工程师交流平台,成长为音频企业上下游多方参与音频技术专业论坛之一,每年还通过举办技术研讨会、年会等活动,搭建起与会的行业供需双方沟通的桥梁。
内容 0
粉丝 0
声学楼论坛 “声学楼”创办于2005年,致力于促进声学领域技术交流与应用。历经多年发展,声学楼已从一个单纯声学工程师交流平台,成长为音频企业上下游多方参与音频技术专业论坛之一,每年还通过举办技术研讨会、年会等活动,搭建起与会的行业供需双方沟通的桥梁。
总阅读0
粉丝0
内容0