美声≠音效
其实,有些方案将“美声”与“音效”混为了一谈。两者实现的效果和实现方式,不尽相同。
怎样让声音更动听?
想要达到这种效果,通常有三种做法:
1.凭借人的训练。知乎上有这样一条问题“怎么练就一副有磁性的声音”,最高赞回答是:按照一定的方法,训练胸腔共鸣,就可以让声音更动听或更有磁性。
2.主要依靠硬件实现。可以通过专业声卡,来实现很好的体验,但是专业声卡,便宜的需要几千元,贵的要上万元。如果选错了声卡,不仅得不到想要的“美声”效果,还会出现延时,影响实时互动的体验。
3.通过软件的方式实现。对音调、音色、动态、韵律、空间效果等进行调节,达到人声的美化。这种方法不仅用户接入门槛低、成本低,并且能保证实时互动的体验。
对一般人而言什么是好声音?
要用软件的方法实现实时的美声,我们就需要先了解,到底什么才是“好声音”?从科学角度,是怎么定义的呢?
男性磁性的声音一般在低频和高频能量较高、中频能量较低;
女性温柔的声音往往会显得节奏缓慢、pitch变化小、咬字模糊等特性。
如何把“好声音”数据化?
答案是:大数据与 AI 算法。
事实上,我们也是基于大数据分析出“男性磁性声音”和“女性温柔的声音”有哪些特征的。

针对场景与性别设计算法
在设计美声相关算法的时候,我们还需要考虑应用场景。我们将场景主要分为两种:一种是语聊场景,比如聊天房、在线教学等。另一种歌唱场景,比如互动直播、线上 K 歌。
美声要效果,也要实时
接下来就要是实现美声的效果了。为了实现美声效果,往往需要对声音的多个维度进行修改,声网Agora是采用链路式多模组联合算法框架,对人声的音调、音色、韵律、节奏、空间、氛围甚至艺术类型等不同维度进行调整。
欢迎体验声网Agora实时美声解决方案
声网Agora 已经推出业界首个实时美声方案,适用于包括语音通话、互动直播、语聊房、开黑聊天室、K歌房、线上KTV、FM 电台、桌游狼人杀等语聊场景,以及互动直播、K歌房、线上KTV、FM 电台等歌唱场景。通过调用一些 API,即可实现。

