虽然魔音工坊目前的功能已经非常强大了,但是全网最挑剔的魔友们,总是对我们提出越来越高(变态)的要求。比如:
魔音真牛逼,不过,要是有重读功能就更完美了。
要是魔音可以把某个字拖音一下就牛逼了。
要是魔音能让配音更有感情就好了,现在还是有点机械。
这里的某个字,合成效果有点儿瑕疵,有什么办法可以编辑调节的么?
魔音团队无时无刻不被用户的需求鞭策着,听说有工程师最近压力过大,都开始脱发了。
可不,为了解决上面的各种问题,我们的工程师小哥,阅读了无数的最新论文,想破了头,或者解决起来技术难度太大,或者数据和研发的成本非常高,有一些功能要很好的解决,还需要每个发音人都投入巨大的成本。
好消息是,熬夜到脱发了的工程师们,找到了一个曲线救国的解决方案。虽然它不是终极的解决方案(灵丹妙药),但是确实是非常好的狗皮膏药,一贴就灵,可以很好的实现「重读拖音」「轻重缓急」的需求,一定程度攻克「情绪不足」的痛点,这个功能就是——声音转换。

来点儿产品功能介绍先。所谓的声音转换,学术术语叫做「说话人转换」,英文名字叫 Voice Conversion,它的功能是把A的说话风格(节奏和韵律等)迁移到B上。转换后的声音,会有B的音色,并拥有A的节奏和韵律等信息。我们尝试给这个功能取了几个不同的名字,大家也可以称之为声音的「移花接木」,「鹦鹉学舌」功能,听名字可能就会「顾名思义」一番,联想到它的功能。
那么我们来听听看,到底「移花接木」能移植到什么效果,「鹦鹉学舌」能学到几分。
我们来一段文案,让我们的呆萌小美女「魔佐伊」充当下旁白声音。
合成上面的音频,小编在魔音工坊的编辑效果图如下:

可以看到,「今天的天气不错呀」这句话,我使用了「声音转换」这个功能。现在我们来仔细对比下「今天的天气不错呀」原声和转换后的魔阿彬的声音。
魔阿彬原始合成效果:
充当声音导演的用户原声:
转换后的魔阿彬:
怎么样, 转换后的声音,是不是比较完美的实现了用户声音的「移花接木」?
那么,有了这个声音转换功能,可以解决什么问题呢? 总体而言,有了这个功能,每个人都是声音的导演,它可以让魔音工坊里的发音人,听你的指挥,合成你想要的效果。这里列几个使用场景给大家参考:
-
某个地方AI合成的效果不太好,比如破音,发音不清晰/不饱满等,可以使用这个功能,让你的AI主播,学习其他AI主播的播报效果,或者是学习你的朗读效果。
-
某个地方需要重读,但是AI却轻描淡写,这时候可以尝试使用声音转换功能,实现「知轻重」的效果。
-
某个地方想要拖音,但是AI读的比较短平快,这时候使用声音转换,可能就能实现「懂缓急」的效果啦。
-
某句关键的台词,AI合成的效果不够出色,感觉AI配音的效果对不起忙了大半天的完美文案(比如视频的开头黄金10秒,用户都希望配音能够出彩)。这时候可以尝试使用声音转换,让你的精彩演绎,赋能给魔音工坊的AI发音人,让声音更生动,富于情绪,更有情感。
有了声音转换功能,你是不是已经有当好声音大导演的冲动啦?
别急,想让小编给你送上一点产品功能使用指南:)
第一步,滑选上需要转换的文本。
第二步,点击工具栏里的「声音转换」功能按钮。
第三步,点击上面的「实时录音」,现场录制。如果有现成的录音文件,可以点击「上传录音」。如果是想要把魔音工坊里另一个发音人的合成音频作为参考,就可以使用「上传录音」功能啦。比如,先使用魔云熙合成这几个字,然后下载音频。接着使用小杰来配音,这里上传魔云熙的配音文件,就可以转换为魔云熙的配音效果啦。
录音完毕,或者「上传录音」选择好本地文件后,窗口会变为如下图所示:

第四步,上传音频。如果想试听录音文件的效果,可以点击左边的播放按钮,不满意的话,可以重新录音,或者选择效果更好的其他配音文件。录音效果没问题的话,点击右侧的「上传音频」。上传后,窗口变为如下图所示:

第五步,选择要转换的发音人,点击头像,即可开始转换。转换后,试听下效果,如果满意,就点击下方的按钮「确定选用“魔阿彬”发音人」。

点击后,在编辑区域中,就会出现如下图的效果啦。

此时点击试听的话,这句话就会被替换为转换后的音频效果啦。
怎么样,操作步骤是不是一学就会? 不过,该功能还是第一个版本,目前只有网站支持该功能,当前也只支持了热门的十个发音人。我们在近期会快速迭代,做几个事情:
1,让魔音工坊自研的主要发音人都支持「声音转换」功能。
2,让交互更为简单快捷。
3,在小程序上支持该功能。

