

使用 TEN Agent+Deepseek 快速搭建语音助手

RTE开发者社区

2025-01-28

导读：语音助手快速搭建指南（限量🧧派送中）

新春快乐！

最近大家都在讨论DeepSeek，他们1月20日发布了AI模型R1，以极低的成本实现了与OpenAI最新模型相当的性能。他们的AI助手应用排名竟然超越ChatGPT，下载第一。我们也一直在关注，很想试试看，能否通过TEN接入。DeepSeek现在注册也有一定的免费额度，可以体验DeepSeek的API。如果你有兴趣，可以试试如何用DeepSeek搭建一个属于自己的语音助手。

今天，我们将介绍如何使用Deepgram、DeepSeek和Fish.Audio在 TEN-Agent^[1] 中搭建一个免费的语音助手。我们将使用Deepgram作为STT（语音转文本）服务，DeepSeek作为LLM（大型语言模型）服务，Fish.Audio作为TTS（文本转语音）服务， Agora作为人与云端AI进行语音RTC实时通信的服务。

欢迎把本教程分享到朋友圈！分享后截图发到公众号后台，前 10 位可以获取限量版🧧红包封面！

前置准备

我们需要先准备一下各个模型服务的 API Key, 各模型的 API Key 可以通过以下方式获取，且都有一定的免费额度，

Deepgram: 注册^[2] 并获取 API Key
DeepSeek: 注册^[3] 并获取 API Key
Fish.Audio: 注册^[4] 并获取 API Key
agora.io: 注册^[5] 并获取 App ID 和 App Certificate

TEN-Agent的开发环境依赖Docker，因此也需要前置安装一下。

搭建 TEN-Agent

接下去，我们需要搭建 TEN-Agent，可以参考 TEN-Agent 快速入门^[6]。

正确启动后，你应该能看到如下界面：

现在我们还没有配置各个模块和他们的API Key，接下去我们将逐步配置。

配置 STT

首先，我们需要配置STT模块，这里我们使用Deepgram作为STT服务。我们需要先打开模块选择器，然后在STT的下拉列表中选择Deepgram并保存，若 STT 模块已经默认选中 Deepgram 则无需操作。

接下去，我们需要配置Deepgram的API Key，点击模块选择器右侧的按钮以打开属性配置，然后在弹出的属性列表中配置你的API Key并保存。

配置 TTS

接下去，我们需要配置TTS模块，这里我们使用Fish.Audio作为TTS服务。我们需要先打开模块选择器，然后在TTS的下拉列表中选择Fish.Audio并保存，若 TTS 模块已经默认选中 Fish.Audio 则无需操作。

接下去，我们需要配置Fish.Audio的API Key，点击模块选择器右侧的按钮以打开属性配置，然后在弹出的属性列表中配置你的API Key并保存。Fish.Audio支持不同的音色，也支持自己Clone音色，如果你想配置其他的音色,可以配置model_id属性。

配置 LLM

最后，我们需要配置DeepSeek作为我们语音助手的LLM模块。因为 DeepSeek 的API是兼容OpenAI API的，因此我们需要选择OpenAI作为LLM模块。我们需要先打开模块选择器，然后在LLM的下拉列表中选择OpenAI并保存，若 LLM 模块已经默认选中 OpenAI 则无需操作。