XSwitch 是一个“连接一切”的综合实时音视频多媒体通信平台,可以连接传统的电话系统以及新兴的通信方式,如 RTC、AI 等。今天,我们将介绍 XSwitch 与 AI 的对接流程。
XSwitch 将语音呼叫与 AI 能力无缝融合,提供「零代码页面配置 + 全开放 API 调用」双模式。核心能力:智能路由、语音识别(ASR)、语音合成(TTS)、大模型对话、知识库问答。
根据不同场景需求,既支持“傻瓜式”页面配置,也支持“全开放 API 调用”,满足企业个性化需求。
资源准备
XSwitch 实例
AI 模型(如 ChatGPT 等)
知识库(如 Markdown 文件)
ASR/TTS 引擎(如百度 ASR、百度 TTS 等)
API Key(如百度 ASR、百度 TTS 等)
API Secret(如百度 ASR、百度 TTS 等)
页面配置
三大配置页:知识库 → 大模型 → AI 机器人,流程清晰,10 分钟完成对接。
创建 大模型(填 url → 填 key → 选模型 → 测通)
创建知识库(Markdown 文件上传,同步然后生成对应 QA 文件,根据场景需求细化或补充 QA)
创建 AI 机器人(绑定模型、知识库、ASR/TTS、AI 响应词)
创建呼叫路由 → 被叫字冠(如10000471)→ 目的地类型「AI 机器人」→ 选刚创建的机器人 → 主题(选填,默认不填即可)→ 保存
拨打10000471测试,实时日志查看 ASR→LLM→TTS 全链路
各页面配置说明
大模型
入口:AI → 大模型 → 新建
新建字段说明
名称:任意,如“GPT-4-cn”
类型:OpenAI / Claude / 文心 / 通义 / 自定义
模版:根据系统默认或已创建好的大模型进行选择,使用模版可快速复制已配置好的大模型,然后修改即可
功能:默认「推理」,选填「嵌入」、「知识库」,根据需求选择
详情参数说明
设置:模型 ID、API Key、API Secret、Base URL等基本配置
- base_url:按厂商填,支持代理地址
- token:按厂商填
- 其他参数可自行添加(model_id:gpt-4-turbo / claude-3)
推理:推理模型
- 如 gpt-4o-mini
嵌入:嵌入模型
- 如 embedding-v1
知识库:知识库模型
- 如 kimi-k2-turbo-preview
工具:工具模型
- 如 qwen-max-1201
知识库
AI 机器人可以通过绑定知识库,实现知识库问答。该功能可以更准确地回答用户的问题,提高用户体验,但是速度较慢,适合回答结构化的问题。
知识库是 AI 机器人回答问题的知识来源,支持 Markdown 文件上传,支持同步,支持下载、删除。
入口:AI → 知识库 → 新建
选择引擎,数据来源于大模型(且只能选择大模型“功能”里选中知识库的大模型)
支持批量 .md 上传,支持同步,支持下载、删除
问答列表,可通过点击「详情」,查看问答语句。调用大模型,点击「自动生成」,一键生成问答对,提交后自动同步到知识库
保存后,后续机器人绑定使用
AI 机器人
AI 机器人是 AI 语音助手的核心,通过绑定大模型、知识库、ASR/TTS、AI 响应词,实现语音对话。
模式设置:
大模型:下拉选择已创建的大模型
语音引擎设置:
ASR 引擎:阿里、百度、讯飞、腾讯、华为等
ASR 模型:根据厂商提供的模型选择
ASR 语言:中文或英文,后续可以再增加其他语音支持
TTS 引擎:同厂商选同区域,可开启“缓存”节省调用
TTS 音色:可选,默认“标准女声”
知识库:
知识库:下拉选择已创建的知识库
知识库匹配精度:0-1,0.7表示匹配到 70% 的相似度,0.9 表示匹配到 90% 的相似度,如果未设置,则默认 0.9
无匹配答案响应词:当知识库匹配不到答案时,返回该响应词,比如“抱歉,我还在学习中,暂时无法回答您的问题”
QA匹配精度:0-1,0.7表示匹配到 70% 的相似度,0.9 表示匹配到 90% 的相似度,如果未设置,则默认 0.9
QA匹配响应词:当从QA里匹配不到答案时,返回该响应词,比如“抱歉,我还在学习中,暂时无法回答您的问题”
AI 响应设置:
提示词:AI 机器人回答问题的提示词,比如“你是一个AI客服助理。,你的名字叫小樱桃。你的公司是烟台小樱桃网络科技有限公司,成立于2016年。公司的主要产品是X Switch,一个实时音视频通信平台。X Switch可以为用户提供一站式语音、视频、会议解决方案,满足企业多样化实时音视频通信需求。支持企业通信、IP-PBX、呼叫中心、视频会议等,支持国产化平台。对客户的问题,尽量简洁、礼貌的回答,如果有不知道的问题,可以说不知道,详细情况可以提示用户到公司网站 https://x-y-t.cn 和产品网站 https://xswitch.cn 上了解。公司的客服电话是0535-6753997。” 提示词越详细,AI 机器人回答问题的准确率越高。
欢迎语:AI 机器人首次对话的欢迎语,比如“你好,我是 AI 机器人,请问我可以帮您什么忙?”
结束语检测词:AI 机器人结束通话的检测词,比如“再见,拜拜,拜,挂了吧”,当用户说出这些词时,AI 机器人会结束对话。
响应词:当用户不说话时,AI 机器人的响应词,比如“您好,还在吗”
响应等待时间:用户不说话时,AI 机器人等待的时间,比如“5”秒,超过这个时间,AI 机器人会播放响应词,比如“您好,还在吗”
打断:是否允许打断,不允许打断时,用户必须等待 AI 机器人回答完才能说话,允许打断时,用户可以随时打断 AI 机器人回答
自动录音:是否自动录音,自动录音后,用户和 AI 机器人的对话会被记录下来,方便后续查看和分析
异步模式:是否异步模式,不同模式下的效果不同,根据实际需求选择
开启滴提示音:是否开启滴提示音,开启后,机器人回答问题之前,会播放滴提示音
方法调用:是否开启方法调用,一般涉及转接等功能时,需要开启方法调用
是否转接:是否开启转接,开启转接后,当AI 机器人识别到用户需要转接时,会自动转接到提示词中配置的转接电话上或根据知识库里配置的转接电话进行转接
转接呼叫源:转接呼叫源,当开启转接后,系统会根据转接呼叫源查询路由,然后转接到路由中配置的目的地上,比如 IVR 、队列等
XCC API 接口自主开发
系统提供的AI机器人页面,可以满足部分场景,如果需要更复杂的定制,建议使用接口自行开发。XSwitch 提供了 XCC API 接口,可以对接 AI 机器人,实现 AI 机器人流程。
AI 机器人流程可以使用如下方式实现:
XCC API:可以使用任何语言开发,有完整的定制和控制能力。(推荐)
REST API:适用于 Web 程序员,可以支持简单的 AI 对话场景。(系统自带AI机器人页面支持相应接口)
Lua:可以使用 Lua 脚本,支持一些简单的对话流程。
XCC 是 XSwitch 提供的二次开发接口,基于 NATS 消息队列实现,可以支持大规模和并发呼叫和横向扩展。XCC 接口支持使用任何语言进行二次开发,如 Go、Python、NodeJS、Java 等。
XCC 是双向的通信协议,使用 XCC 接口,可以接收完整的呼叫状态通知(呼叫中、振铃中、已接通、正在录音、已挂机等),适用于复杂的场景,对外呼流程需要。
关于 XCC 接口请参见相关文档: <https://docs.xswitch.cn/xcc-api/> 。
XCC 接口仅用于呼叫控制,不处理音视频媒体流,真正的音视频媒体流都是在 XSwitch 中处理的。一个示例外呼流程如下:
外呼程序(以下称呼叫控制器,即 Controller)调用 XCC 的 Dial 接口发起外呼请求
XSwitch 执行外呼请求,发起呼叫
对方手机应答后,XSwitch 通知 Controller
Controller 将呼叫转入 AI 机器人流程
一个示例 AI 机器人流程如下:
Controller 调用 Play 接口播放欢迎音
Controller 调用 Record 接口录音
Controller 调用 ASR 接口识别用户说话内容
XSwitch 检测到用户说话内容后,通知 Controller
Controller 调用 NLP 或大模型处理用户说话内容,返回回答文本
Controller 调用 Play 接口播放回答文本
进入下一轮语音识别
XCC 相关的架构如下:
AIGC 接入
AIGC 一般指 ChatGPT 类似的对话机器人接入。XSwitch 通过 CherryGPT 支持 ChatGPT、腾讯混元等对话机器人接入。
CherryGPT是一个Controller的具体实现,一端可以连接XSwitch,一端连接大模型(ChatGPT),实现AI对话。
CherryGPT 通过XCC协议连接 ChatGPT。架构图如下:
交互流程时序图如下:
关于 CherryGPT,详见:https://docs.xswitch.cn/cherry-gpt/ 。
支持与反馈
如果您在使用过程中遇到任何问题,或者有任何建议和反馈,请随时联系我们的技术支持团队。
让每一次呼叫都更智能 —— XSwitch AI
广告时间:
我们在招募XSwitch集成商及代理,如果您对这方面感兴趣,可点击下方图片查看详情。

