当AI不仅能创造内容,还能创造工具:游戏音频的未来
从"让AI做音频"到"让AI做工具"
还记得两年前AI生成音乐带来的热潮吗?从那时起,各大游戏厂商争相展示用AI生成的音频内容。仿佛一夜之间,游戏音频制作的门槛被彻底拉低。但这只是AI改变游戏音频的第一阶段。 如今,我们正站在第二阶段的起点:AI不再仅仅是内容的生产者,它开始成为工具的创造者——从“让AI做音频”到“让AI做工具”。 坦白说,第一阶段的AI生成内容(AIGC)确实很惊艳,也解决了不少问题:研发版本中的配音可以用AI生成;等不了长时间音乐制作流程的需求,也可以用AI音乐来救场。这些已经慢慢改变了以往的工作流程和经验。 然而,真正的痛点其实是在工具层面。游戏音频主要会用到三类软件:DAW音频工作站、中间件声音引擎和游戏引擎。它们来自不同厂商、不同年代,开发理念各不相同。如果能有一套工具从本地素材管理开始,贯穿至制作、创作、声音引擎验证游戏内效果等环节,将大幅提高游戏研发效率。 “我们日常有些工作其实是重复性工作,比如本地文件管理、修改名称、引擎的导入、建立Event和Bank…”有天我们团队的阿震曾这样抱怨,“如果能把这些时间省下来专注创作,项目质量肯定能提升一个档次。” 这句话成了我们音频团队探索AI自编程工具的起点。与其让AI替代创作,不如让AI创造工具,解放创作者的双手。 过去半年,我们开发了一系列AI自编程音频工具,它们不是高深莫测的黑科技,而是解决实际问题的“及时雨”。今天,我想和大家分享这些小工具背后的故事。我们用AI做的工具
1. 二次元模拟器 有没有在音频工作站和声音引擎、游戏引擎之间,能够快速体验声音效果和进行交互混音的工具?这是不少音频设计师一直渴望的。 最初我尝试设计一个小软件,把RPG、SLG以及即时操作反馈的音效和音乐按照游戏逻辑运行起来,模拟游戏中的真实效果给策划同学听,也给音频同学辅助混音。于是有了我们的第一个自研工具:二次元模拟器。 快速读取音频资源后,它可以立即演示游戏效果。有趣的是,这个最初只是一个简单文字界面脚本的工具,后来在AI协助下进化成了一个带UI的独立程序。AI不仅帮我们优化了算法,还生成了很多代码。 2. 更大规模混音 但我们很快发现这个工具模拟的类型比较单一,于是考虑是否可以设计一款“交互声音混音”工具,用于游戏中各种声音的混合。 在敲定最初的结构设计后,我们开发了这样一款软件:Interactive Mixing。 游戏中的战斗、主城、剧情等各种场景,都可以快速模拟听觉效果并进行多事件混音。当然,这款软件也经历了许多迭代和调整,才最终达到稳定可用的状态。 3. 让AI音乐工具更懂人话 主流的AI音乐软件主要是通过提示词方式实现人机交流,即text to music。所以提示词的描述非常关键。但如果你用过AI音乐生成工具,一定会遇到一个问题:如何准确描述你想要的音乐? 我开发了AI音乐提示词生成器,旨在解决这一难题。该程序能将策划、程序员、美术以及音频人员的口语化描述转化为专业、精确的音乐提示词,在人类自然语言和扩散模型之间架起了桥梁。生成的提示词可直接对接Suno工具接口,显著提高了音乐生成效率。 4. 为声音引擎设计助理程序 据我们的不完全统计,一个中型游戏项目中,音频设计师在Wwise界面上的点击次数可能超过10万次,其中大部分是重复操作。 如果能实现从本地文件夹到Wwise内容Audio、Event、Bank多层结构的一键导入和管理,那设计师的工作效率将提升数倍。 因此我们的一位资深设计师欧阳师傅动起了这个脑筋,并通过AI逐步将其变为现实。令人惊讶的是,AI不仅优化了代码,还实现了多套工具的底层链接。在这个过程中我们也踩了不少坑,被动学到了很多宝贵经验(苦笑)。 以前没有这类工具时,处理四位数句子数量的语音录音文件需要上百小时;而有了它之后,只需要几十分钟即可完成。自研工具与AI赋能:游戏音频开发效率的革新
管理海量音频文件,探索AI与游戏结合新可能
我们开发了一套本地音频文件管理工具,例如阿震设计的批量修改文件名工具,可以根据游戏版本信息快速进行文件名称管理。

通过这些自主开发的工具,我们在提升工作效率的同时,也对AI在游戏领域中的应用更加充满期待。
结语
回顾工具开发过程,我们发现一个有趣的现象:AI确实能显著提升效率,但核心价值依然来自人类的创意和需求。
AI可以加速工具的开发过程,但工具的设计思路与使用场景仍依赖一线从业者的经验和洞察。我的体会是:一旦掌握了工具开发能力,使用者就能根据最迫切的需求创造出最适合的内容。这也是我们称之为“第二阶段”的原因——AI并非替代人类,而是增强人类的能力。
未来,游戏音频领域将迎来更多AI辅助工具,它们将持续优化我们的工作方式。但无论技术如何发展,创造力与审美判断仍是这一领域的核心。

