(一)Podcastle AI
Podcastle AI非常适合将文本转换为语音。
该程序提供录音室质量录音、AI调色板编辑和CMS导出等功能,并提供音频检测和语音到文本音频翻译等工具。
(二)天工乐府SkyMusic
天工乐府SkyMusic是国内第一款商用级作曲AI模型,它不但可以编曲,还能基于旋律或是文案素材创作歌词,发行AI生成的商用歌曲,甚至有ISRC版权认证,可在交易市场买卖流通。
(三)Mubert
Mubert是一个在线人工智能生成音乐的网站。
通过结合人工智能的能力和音乐制作人的创造力,使人类与算法之间的共生关系成为可能。
来自数百位艺术家的数百万个样本输入Mubert,使人工智能从中学习创作音乐的能力。
每首新的免版税音乐都会立即生成,并完美适配各种场景。
人类和AI技术结合在一起,能带来完美的声音。
(四)Make-An-Audio
浙江大学、北京大学联合火山语音,共同提出了一款创新的、文本到音频的生成系统,即Make-An-Audio。
其可以将自然语言描述作为输入,而且是任意模态(例如文本、音频、图像、视频等)均可,同时输出符合描述的音频音效,具有强可控性、泛化性。
(五)MusicLM
谷歌最新推出的AI模型MusicLM,可直接将文字、图像自动生成音乐,并且曲风多样,凡是想听的音乐,基本都能自动生成。
(六)Riffusion
Riffusion的工作原理是首先构建一个索引的频谱图集合,上面标记代表频谱图中捕获的音乐风格的关键字。
在频谱图主体上训练时,Riffusion就用与Stable Diffusion相同的方法——干预噪声,来获得与文本提示匹配的声波图像。

