从更流畅拟人的端到端语音模型,到主动倾听与实时打断的全双工技术,再到前沿音频技术的突破与智能体落地——由科大讯飞 AI 工程院和声网联合出品的「语音 AI 技术专场」将深入探讨构建下一代语音 AI 的核心技术与未来方向。
北京,11 月 1 日上午,Convo AI&RTE2025 「实时互联网大会暨对话式 AI 论坛」。
我们邀请到了诸位技术专家、开发者和创业者,加入我们这场前沿讨论:
孟廷,讯飞寰语 AI 研究院副院长
徐广健,声网高级音频技术专家
武执政,香港中文大学(深圳)副教授、博导
张栋,小米大模型 Core 团队首席研究员
谢磊,西北工业大学教授,音频语音与语言处理实验室负责人
钱彦旻,上海交通大学特聘教授,教育部长江学者
孙思宁,声绘未来(北京)科技有限公司 CEO
来 Convo AI & RTE2025 「语音 AI 技术专场」,加入我们的讨论,一同提问,一同寻找答案!
除了本场论坛,你还可以在 10 月 31 日-11 月 1 日,逛遍 7 场技术论坛和 40 多场主题分享和圆桌讨论,一起来探索对话式 AI、Voice Agent、多模态 AI……与 RTE 的碰撞吧!
【左右滑动查看更多】
加入我们的 Voice Agent 社区
RTE 开发者社区持续关注 Voice Agent 和语音驱动的下一代人机交互界面。如果你对此也有浓厚兴趣,也期待和更多开发者交流(每个月都有线上/线下 meetup,以及学习笔记分享),欢迎加入我们的社区微信群,一同探索人和 AI 的实时互动新范式。
加入我们:加微信 Creators2022,备注身份和来意(公司/项目+职位+加群),备注完整者优先加群。

硅谷顶级 VC 如何看语音 AI?Greylock 合伙人揭秘 Voice Agent 构建的三层策略
AI 客服还不够聪明,但已超过月薪五千的人类丨RTE Meetup 回顾
引爆 AI 会议工具潮流,Granola 打造 2.5 亿美元估值产品的秘密丨Voice Agent 学习笔记
活动回顾丨主动式语音 AI:全双工加持,让 AI 既会抢答也懂适时沉默丨RTE Meetup
GPT-4o 之后,Voice 从 Assistant 到 Agent,新机会藏在哪些场景里?|Voice Agent 学习笔记
对话 Wispr Flow 创始人 Tanay:语音输入,如何创造极致的 Voice AI 产品体验
Notion 创始人 Ivan Zhao:传统软件开发是造桥,AI 开发更像酿酒,提供环境让 AI 自行发展
ElevenLabs 语音智能体提示词指南——解锁 AI 语音交互的「灵魂秘籍」丨 Voice Agent 学习笔记
11Labs 增长负责人分享:企业级市场将从消费级或开发者切入丨Voice Agent 学习笔记
实时多模态如何重塑未来交互?我们邀请 Gemini 解锁了 39 个实时互动新可能丨Voice Agent 学习笔记

