大数跨境

四 AIGC音频生成

四 AIGC音频生成 数组智控产业发展科技院
2023-10-19
1
导读:(一)Podcastle AIPodcastle AI非常适合将文本转换为语音。该程序提供录音室质量录音、A

(一)Podcastle AI

Podcastle AI非常适合将文本转换为语音。

该程序提供录音室质量录音、AI调色板编辑和CMS导出等功能,并提供音频检测和语音到文本音频翻译等工具

(二)天工乐府SkyMusic

天工乐府SkyMusic是国内第一款商用级作曲AI模型,它不但可以编曲,还能基于旋律或是文案素材创作歌词,发行AI生成的商用歌曲,甚至有ISRC版权认证,可在交易市场买卖流通。

(三)Mubert

Mubert是一个在线人工智能生成音乐的网站。

通过结合人工智能的能力和音乐制作人的创造力,使人类与算法之间的共生关系成为可能。

来自数百位艺术家的数百万个样本输入Mubert,使人工智能从中学习创作音乐的能力。

每首新的免版税音乐都会立即生成,并完美适配各种场景。

人类和AI技术结合在一起,能带来完美的声音。

(四)Make-An-Audio

浙江大学、北京大学联合火山语音,共同提出了一款创新的、文本到音频的生成系统,即Make-An-Audio。

其可以将自然语言描述作为输入,而且是任意模态(例如文本、音频、图像、视频等)均可,同时输出符合描述的音频音效,具有强可控性、泛化性。

(五)MusicLM

谷歌最新推出的AI模型MusicLM,可直接将文字、图像自动生成音乐,并且曲风多样,凡是想听的音乐,基本都能自动生成。

(六)Riffusion

Riffusion的工作原理是首先构建一个索引的频谱图集合,上面标记代表频谱图中捕获的音乐风格的关键字。

在频谱图主体上训练时,Riffusion就用与Stable Diffusion相同的方法——干预噪声,来获得与文本提示匹配的声波图像。


【声明】内容源于网络
0
0
数组智控产业发展科技院
以AI技术为底层能力,聚焦智慧园区、城市公共安全、数智警务、健康医疗、能源电力、科研实验及平安校园等领域,提供从感知到决策的全流程软硬件一体化的国产装备智能体产品解决方案。
内容 986
粉丝 0
数组智控产业发展科技院 以AI技术为底层能力,聚焦智慧园区、城市公共安全、数智警务、健康医疗、能源电力、科研实验及平安校园等领域,提供从感知到决策的全流程软硬件一体化的国产装备智能体产品解决方案。
总阅读2.3k
粉丝0
内容986