多模态是从 LLM 到 AGI 的必经之路。
从 AI 视频生成到可实时交互的世界模型,从被动响应到主动感知与交互,再到下一代多模态大模型的设计与构建——由商汤科技和 RTE 开发者社区联合出品的「多模态技术专场」将展望一个由实时多模态 AI 驱动的未来。
北京,11 月 1 日下午,Convo AI&RTE2025 「实时互联网大会暨对话式 AI 论坛」。
我们邀请到了诸位技术专家、开发者和创业者,加入我们这场前沿讨论:
路少卿,商汤科技多模态交互产品负责人
冯睿蠡,加拿大滑铁卢大学访问学者
俞刚,阶跃星辰语音和 AIGC 算法负责人
刘一聪,和众科技 HooRii Technology,Co-Founder & CTO
顾嘉唯,灵宇宙创始人
来 Convo AI & RTE2025 「多模态技术专场」,加入我们的讨论,一同提问,一同寻找答案!
除了本场论坛,你还可以在 10 月 31 日-11 月 1 日,逛遍 7 场技术论坛和 40 多场主题分享和圆桌讨论,一起来探索对话式 AI、Voice Agent、多模态 AI……与 RTE 的碰撞吧!
【左右滑动查看更多】
加入我们的 Voice Agent 社区
RTE 开发者社区持续关注 Voice Agent 和语音驱动的下一代人机交互界面。如果你对此也有浓厚兴趣,也期待和更多开发者交流(每个月都有线上/线下 meetup,以及学习笔记分享),欢迎加入我们的社区微信群,一同探索人和 AI 的实时互动新范式。
加入我们:加微信 Creators2022,备注身份和来意(公司/项目+职位+加群),备注完整者优先加群。

硅谷顶级 VC 如何看语音 AI?Greylock 合伙人揭秘 Voice Agent 构建的三层策略
AI 客服还不够聪明,但已超过月薪五千的人类丨RTE Meetup 回顾
引爆 AI 会议工具潮流,Granola 打造 2.5 亿美元估值产品的秘密丨Voice Agent 学习笔记
活动回顾丨主动式语音 AI:全双工加持,让 AI 既会抢答也懂适时沉默丨RTE Meetup
GPT-4o 之后,Voice 从 Assistant 到 Agent,新机会藏在哪些场景里?|Voice Agent 学习笔记
对话 Wispr Flow 创始人 Tanay:语音输入,如何创造极致的 Voice AI 产品体验
Notion 创始人 Ivan Zhao:传统软件开发是造桥,AI 开发更像酿酒,提供环境让 AI 自行发展
ElevenLabs 语音智能体提示词指南——解锁 AI 语音交互的「灵魂秘籍」丨 Voice Agent 学习笔记
11Labs 增长负责人分享:企业级市场将从消费级或开发者切入丨Voice Agent 学习笔记
实时多模态如何重塑未来交互?我们邀请 Gemini 解锁了 39 个实时互动新可能丨Voice Agent 学习笔记

