「云栖来了」是阿里云云栖号推出的特别栏目,带您每天获取2025云栖大会的最新资讯。前瞻了解今年大会带来的“AI价值落地全景”:从“云智一体”的全栈AI技术,到开源开放的技术和应用创新生态,再到“Agent化”、具身智能为代表的“碳硅共生”新世代。让我们和全球AI创新者一起,迎接2025云栖大会的到来。
随着2025云栖大会进入倒计时,国内领先的大模型企业自由量级正式宣布,将携其全自研的音潮音乐大模型,及依托该模型开发的一站式AI音乐平台亮相大会。凭借多项创新功能与突破性体验,音潮致力于重新定义音乐创作的边界,推动音乐平权时代的到来。
传统音乐产业长期面临着生产门槛高,消费头部效益明显的特征。这导致行业生态相对固化,新兴创作者与多元化音乐内容的涌现受到制约。然而人工智能技术的飞速发展,正以前所未有的力量重塑音乐创作格局。洞察到这一颠覆性变革的机遇,自由量级在今年7月推出了“音潮”。
现场体验“音潮”颠覆
在今年的云栖大会上,参会者可以现场体验音潮提供的跨模态创作功能。单凭一段天马行空的文字描述、一张随手拍下的照片、甚至是随口哼出的小曲儿,音潮涌现就能带来一首带人声演唱充满表现力的完整歌曲。
这意味它能够精准解析文本、画面、旋律中的情绪、风格与场景需求,自动生成旋律、节奏、和弦等音乐元素;而完成整个创作的过程只需要短短一分钟,甚至仅仅15秒你就能听到这首歌的第一个旋律。
对于具备一定基础的用户,“音潮”还提供了前所未有的多维度精细控制能力。包括曲风能够支持如古典流行、电子、国风等多样音乐类型,对输入的音乐风格指令实现高精度的遵循;还能够支持乐器编排,可以细化要求要求主奏乐器、打击乐类型及强度、和声铺底等;甚至可以调节音乐的情感基调。
产品负责人张昆透露:“实际上,音潮还具备了包括参考风格生成音乐,音乐续写、声纹复刻等黑科技功能,我们也期待大家来现场逐一解锁。”
全自研音乐模型 国内领先
音潮依托自由量级0到1全自研的音乐大模型——“音潮音乐”。该模型采用行业领先的AR+NAR架构,拥有强大的多模态表征能力,能够捕捉全局动态变化并进行高保真重建。大模型中,表征环节往往反映模型能力的边界,音潮大模型的表征部分接受多种媒体输入,涵盖声音、文字、图片甚至视频,并在相同的高维空间进行统一表征。
同时,团队依托于合作的音乐领域专家,将底层语言模型的训练与专业的音乐制作过程相融入,使得音乐生成不再是一味地“模仿”,而是进行真正的音乐“创作”。
创新的重建模型则深入学习了音乐信号与其他信息的结构性差异,对信号中的音乐特征独立建模,建立复合评价维度,这克服了传统方案在处理时所遇到的音乐细节丢失难题,能够帮助模型生成具有丰富编曲层次、工业级制作听感的高质量音乐。表征模型与重建模型的高度“音乐化”,实现了从“意图理解”到“高品质音乐表达”的无缝转化。
阿里云全链条助力
“音潮”的快速研发与高效部署,离不开阿里云全链路技术服务的强力支撑。其强大的弹性计算(ECS)与高性能GPU集群,保障了海量数据训练与模型迭代的效率;阿里云PAI则在大模型开发、训练和推理部署环节提供了关键工具链支持,极大提升了研发效率。
这也是“音潮音乐”模型能够成为国内TOP级音乐模型的重要原因。
此外,由于音乐垂直模型训练的特殊性,其对于数据的存储和存取的要求非常高。而依托于阿里云机间和卡间的高效通讯网络,确保了多模态训练数据的安全存储与快速存取。
未来,音潮计划与阿里云深度合作,进一步赋能企业级与开发者生态,共同推动AI音乐创作的普及与应用。

