

FunPlus总监级大佬实战分享：创造工具是AI生产力的第二阶段

游戏葡萄

2025-05-27

116

导读：当AI不仅能创造内容，还能创造工具，游戏音频的未来才真正开始。

当AI不仅能创造内容，还能创造工具：游戏音频的未来

从"让AI做音频"到"让AI做工具"

还记得两年前AI生成音乐带来的热潮吗？从那时起，各大游戏厂商争相展示用AI生成的音频内容。仿佛一夜之间，游戏音频制作的门槛被彻底拉低。但这只是AI改变游戏音频的第一阶段。如今，我们正站在第二阶段的起点：AI不再仅仅是内容的生产者，它开始成为工具的创造者——从“让AI做音频”到“让AI做工具”。坦白说，第一阶段的AI生成内容（AIGC）确实很惊艳，也解决了不少问题：研发版本中的配音可以用AI生成；等不了长时间音乐制作流程的需求，也可以用AI音乐来救场。这些已经慢慢改变了以往的工作流程和经验。然而，真正的痛点其实是在工具层面。游戏音频主要会用到三类软件：DAW音频工作站、中间件声音引擎和游戏引擎。它们来自不同厂商、不同年代，开发理念各不相同。如果能有一套工具从本地素材管理开始，贯穿至制作、创作、声音引擎验证游戏内效果等环节，将大幅提高游戏研发效率。 “我们日常有些工作其实是重复性工作，比如本地文件管理、修改名称、引擎的导入、建立Event和Bank…”有天我们团队的阿震曾这样抱怨，“如果能把这些时间省下来专注创作，项目质量肯定能提升一个档次。” 这句话成了我们音频团队探索AI自编程工具的起点。与其让AI替代创作，不如让AI创造工具，解放创作者的双手。过去半年，我们开发了一系列AI自编程音频工具，它们不是高深莫测的黑科技，而是解决实际问题的“及时雨”。今天，我想和大家分享这些小工具背后的故事。

我们用AI做的工具

1. 二次元模拟器 有没有在音频工作站和声音引擎、游戏引擎之间，能够快速体验声音效果和进行交互混音的工具？这是不少音频设计师一直渴望的。最初我尝试设计一个小软件，把RPG、SLG以及即时操作反馈的音效和音乐按照游戏逻辑运行起来，模拟游戏中的真实效果给策划同学听，也给音频同学辅助混音。于是有了我们的第一个自研工具：二次元模拟器。快速读取音频资源后，它可以立即演示游戏效果。有趣的是，这个最初只是一个简单文字界面脚本的工具，后来在AI协助下进化成了一个带UI的独立程序。AI不仅帮我们优化了算法，还生成了很多代码。 2. 更大规模混音 但我们很快发现这个工具模拟的类型比较单一，于是考虑是否可以设计一款“交互声音混音”工具，用于游戏中各种声音的混合。在敲定最初的结构设计后，我们开发了这样一款软件：Interactive Mixing。游戏中的战斗、主城、剧情等各种场景，都可以快速模拟听觉效果并进行多事件混音。当然，这款软件也经历了许多迭代和调整，才最终达到稳定可用的状态。 3. 让AI音乐工具更懂人话 主流的AI音乐软件主要是通过提示词方式实现人机交流，即text to music。所以提示词的描述非常关键。但如果你用过AI音乐生成工具，一定会遇到一个问题：如何准确描述你想要的音乐？我开发了AI音乐提示词生成器，旨在解决这一难题。该程序能将策划、程序员、美术以及音频人员的口语化描述转化为专业、精确的音乐提示词，在人类自然语言和扩散模型之间架起了桥梁。生成的提示词可直接对接Suno工具接口，显著提高了音乐生成效率。 4. 为声音引擎设计助理程序 据我们的不完全统计，一个中型游戏项目中，音频设计师在Wwise界面上的点击次数可能超过10万次，其中大部分是重复操作。如果能实现从本地文件夹到Wwise内容Audio、Event、Bank多层结构的一键导入和管理，那设计师的工作效率将提升数倍。因此我们的一位资深设计师欧阳师傅动起了这个脑筋，并通过AI逐步将其变为现实。令人惊讶的是，AI不仅优化了代码，还实现了多套工具的底层链接。在这个过程中我们也踩了不少坑，被动学到了很多宝贵经验（苦笑）。以前没有这类工具时，处理四位数句子数量的语音录音文件需要上百小时；而有了它之后，只需要几十分钟即可完成。