7 月 26-29 日,上海,世界人工智能大会 WAIC 2025,来全球 AI 领域最受关注的盛会相遇!
本次盛会汇聚了全球 AI 行业领导者、初创企业和新锐开发者。其中在世博展览馆有 200 家创新项目在 Future Tech 展区交流。作为合作伙伴,RTE 开发者社区推荐的多个项目也入选其中。
我们还准备了 Voice Agent & Real Time AI 技术开放麦、对话式 AI Workshop 等活动,欢迎你来一起感受交流技艺,探索新知的乐趣!
请翻阅这篇指南,不要错过任何精彩内容。别忘了加入我们的小红书「语音 AI 线下聊@WAIC」群聊,线上交友线下聊!
我们还准备了免费门票送给你,请留意文末彩蛋!
希望你能在 WAIC 结识志同道合的朋友,期待与你一起探索 Voice AI 的未来~
线上交友线下聊:加入小红书群
我们新建了「语音 AI 线下聊@WAIC」小红书群。进群后,接龙「参会日期+一句话介绍」,就可以线下约着见面了!接龙项目还有机会被邀请参加 28 日在大会现场举办的「Voice Agent&Real Time AI 」主题技术开放麦!
所有参加大会,想来聊聊天、交流语音 AI 经验的朋友都欢迎扫码加入,期待与你一起探讨 Voice Agent 新的可能!
世界人工智能大会基本信息
时间:2025 年 7 月 26-29 日,周六-周二
地点:上海世博中心、世博展览馆、徐汇西岸等
本次我们的展位和活动都在 Future Tech 展区,地址是世博展览馆 H4 全域链接馆。可以在地图上找到心仪项目的位置,轻松规划参观路线~
>> WAIC 2025 Future Tech 展区活动一览
H4 展馆平面图
两场语音 AI 活动
对话式 AI workshop
7.28 13:00-14:00,世博展览馆 H4 馆全域链接馆
参与方式:购票后在大会平台报名
TEN Framework 发起了对话式 AI workshop,从行业前沿到动手实践,带你一小时入门 TEN Framework 与 Voice Agent 开发。
VoiceAgent&Real Time AI 技术开放麦
7.28,14:00-15:00,世博展览馆 H4 全域链接馆
参与方式:无需报名,技术开放麦全天运转,但语音 AI 专场只有这一小时,请定好闹钟来找我们玩!
14:00-14:15
主题分享一:刘涛,MetaBooks 联合创始人:打破沉默的绘本:AI 让阅读变成对话
14:15-14:30
主题分享二:张浩泽,Chikka.ai 联合创始人:告别问卷时代:AI 语音调研让企业深度洞察每一位顾客
14:30-14:45
主题分享三:Bobby,ErroRightAI CPO:MiBai 产品思考:远程空间交互场景下 Real-Time AI 如何定位
14:45-15:00
Lightning demo:欢迎加入小红书群提前报名~
🌈 社区推荐初创展商:探索 Voice Agent 无限可能
7 月 26-29 日,世博展览园 H4 馆全域链接馆
Chikka.ai
展位号【H4-FT311】
Chikka.ai 是一款 AI 语音顾客访谈智能体,只需一句研究目标,用户即可创建专属的个性化语音调研员 Ava。她能与真实顾客展开温暖、自然、有共情力的对话,主动提出有深度的问题,帮助企业高效获取真实、富有洞察力的客户反馈。这些语音内容还能自动转化为可发布的多媒体证言素材,助力品牌营销与客户增长。
FOLOTOY
(上海喜梨信息有限公司)
展位号【H4-FT702】
FoloToy 是上海喜梨信息有限公司旗下 AI 玩具品牌,首创将大语言模型应用于玩具,开拓了对话式 AI 玩具赛道,并打造了儿童认知与陪伴超级智能体,旨在为每个孩子提供高质量智慧陪伴和个性化学习的机会,重新定义家庭娱乐与教育方式。凭借深厚的技术积累和全链路整合能力,FoloToy 已成长为 AI 智能玩具领域的头部品牌。
Viitor AI
展位号【H4-FT313】
ViiTor AI 是一个专注于音视频 AI 处理的一站式网站平台,提供视频翻译、声音克隆、语音合成、语音翻译等功能。致力于打破语言与沟通的障碍,赋能内容创作者,以 AI 技术提供更沉浸式的多媒体体验。
RWKV(元我智能)
展位号【H4-FT305】
RWKV 是元我智能旗下自研的世界首个 RNN 大模型架构,也是目前计算效率最高、算力需求和能耗最低的架构。2024 年,微软对全球几亿台 Windows 系统设备部署了 RWKV 运行库,RWKV 成为部署最广泛的开源模型之一。RWKV.cn 已收录来自知名高校、名企及研发机构近 100 篇与之相关的论文,包括斯坦福大学、清华大学、腾讯、Meta、上海人工智能实验室等。
TEN Framework
展位号【H4-FT306】
TEN Framework 是一个主流对话式 AI 开源框架,由声网与社区共同支持。 TEN 目前已集成全球主流 STT、LLM、TTS、RTC、RAG 等多种模型及组件,包括 Deepseek、OpenAI、Gemini 等同时适配 Dify、Coze 等主流编排工具,内置优化后的实时通信能力,提供低延时、可打断的交互体验,快速让你的 AI bot 能听能说。 TEN 可用于搭建任何类型的 Voice Agent,如:语音 AI 助手、AI 情感陪伴、AI 口语陪练等场景。
云蝠智能(星蝠科技)
展位号【H4-FT511】
云蝠智能是国内领先的 AI 语音智能体服务商,依托大模型技术打造全流程智能销售平台。核心产品 「VoiceAge 呼叫智能体」 率先在国内实现「语音流中的大模型协同」机制,系统基于豆包、通义千问与 DeepSee 等多大模型引擎的深度融合,通过语音实时协作,实现 呼出 + 呼入 + 数据分析 +流程执行 的一体化闭环。作为国内首家多模型协同驱动智能体平台,实现呼叫全流程自动化,产品广泛适用于智能营销、客服接待、回访调研、订单确认、AI 面试等高频业务场景,为企业带来人效跃升与服务。
ANP 开源社区
展位号【H4-FT310】
ANP 开源技术社区是一个开放中立、非营利性的开源社区,致力于定义智能体的连接与协作。社区的开源项目 ANP(AgentNetworkProtocol)是全球最早的智能体通信协议,目标是成为智能体互联网时代的 HTTP,让互联网中的任意两个智能体能够进行跨平台的身份认证与互联互通,构建一个开放、高效、安全的智能体协作网络。ANP 在 W3C 牵头成立 AI Agent Protocol 标准组,获华为、谷歌、微软等巨头参与共建智能体互联生态。
✊ 独立开发者小分队:让世界听到独立创新的声音
本次 WAIC 活动期间,我们准备了三个展位,邀请了 9 个独立开发者团队来分享他们的精彩项目。每天都有三个团队参与互动,希望能给你带来新鲜的创意和灵感!
7月27日
无默触感音乐播放器
展位号【H4-HT021】
无默旨在通过创新的触觉技术让触摸音乐成为可能,把音乐的震撼和美妙传递给每个人。音乐是心灵的语言,它跨越了时空的界限,触动着我们每一个人的灵魂。触感同样是每个人感知世界的重要通道,尤其是对于那些生活在无声世界中的听障朋友们。 无默由 AI 触感算法驱动,能够实时自动生成和音乐匹配的触感效果,你可以通过振动感受到节奏和旋律的变化。我们致力于打造一个听障友好的环境,让音乐的力量能够触及每一个人。
口袋植物
展位号【H4-HT022】
口袋植物的主旨:用每一次养护灌溉你的园艺天赋。 口袋植物是一款诞生于 AI 时代的植物管理软件,致力于为植物爱好者提供极简、个性化且更智能的植物养护方式。该项目由一位独立开发者独立完成,在 AI 的赋能下,实现了快速收集用户反馈并高效迭代。未来,口袋植物也将深度应用 AI 技术,帮助用户更高效、更精准地管理心爱的植物,并量身定制专属的养护计划。
结构主义 Structuralism
展位号【H4-HT023】
《结构主义》是一款基于构筑与物理交互的 XR 独立游戏,灵感来源于建筑艺术。玩家通过搭建结构来完成关卡任务,探索逻辑与空间的无限可能。游戏美术风格独特,结合哲学、生物、天文等多领域背景,呈现丰富多彩的互动内容。通过巧妙设计的手势交互与真实物理模拟,玩家在解谜与构建中获得乐趣,体验空间交互的独特魅力。
7月28日
角端阅读器(无壁科技)
展位号【H4-HT021】
角端阅读器是一款能够帮用户打破语言障碍、轻松阅读全球书籍、理解异国文化背景、和全球用户交流的软件。 我们的愿景是:「让每本书都找到它的读者,让所有人都能用母语读遍天下书。」 通过异步流式加载算法和 LLM 文本解释,我们把用户阅读一本外语书的平均总等待时长减少了 80%以上,总操作步数减少 90%以上,支持超过 100 种语言,AI 自动生成成语、俗语、双关语的注释条目辅助用户理解。 通过 AI 推理大模型自动校对和小语种翻译模型训练,能够实现「一本书看的人越多,翻译就越准,翻译模型也越强」的闭环。
eyeOS
展位号【H4-HT022】
eyeOS 致力于通过前沿科技重新定义视觉感知边界,旨在给视障群体带来「未见之见」。我们希望探索视障群体与世界新的交互方式。 我们正在构建一款面向视障群体出行的综合性解决方案,包括深度学习算法、移动应用平台与智能穿戴终端,帮助视障人群在复杂环境中实现独立、安全、自信的探索。 当前产品目前正处于功能优化与社群测试阶段,团队正与视障社群及相关机构共同建设一个共创共治的支持型生态系统,推动一场关于平等、尊重与探索权的社会实践。
MetaBooks
展位号【H4-HT023】
MetaBooks 致力于教育科技前沿,是国内领先的基于 AIGC 的中英文互动绘本学习应用。 融合 AIGC 生成式阅读与多模态交互式 AI,首次实现 AI 驱动 3D 绘本与真人级语音对话深度融合,填补智能教育领域关键技术空白。 平台提供个性化互动绘本沉浸式 3D 体验与 AI 语音互动,实现「边看、边问、边玩、边学」的语言学习新模式。 同时支持用户创作绘本内容,志在打造国内首个 AIGC 驱动的原创多模态内容平台。 以「AI 赋能,开启多模态学习的新时代」为理念,点亮孩子语言学习世界,让普惠化 AI 教育走进千家万户。
7月29日
MiBai(或宇连接)
展位号【H4-HT021】
或宇连接(ErroRightAI)是由科创教父李泽湘教授在深圳孵化,公司专注于通过 AI 与机器人技术赋能人与人之间的连接和互动。我们发布的核心产品 MiBai-V6 桌面机器人,是全球首款远程孪生互动 AI 桌面机器人,具有具身降临、空间交互、电子伙伴三大特点,开创了「触感可及」的情感连接新范式,为现代人际交流带来全新体验。欢迎关注和了解我们,共同构建全新的、富有温度的互动方式,重新定义远程空间中人与人之间的连接和互动。
合理原则 REAZENABLE
展位号【H4-HT022】
合理原则品牌致力于在智能时代,保留智能化便捷人类的同时,保留更多自然之美,让真正自然的感官体验走到用户家中,产品采用与北极光等自然光的原理,一比一将自然之美放到用户家里,去除 LED 人造光对人眼及生物节律的影响,真正做到用自然的原理疗愈身心;真 3D 的光效体验,外壳采用沙子制成, 完全可回收,用自然的材质承接自然的美感。
GRAVITY(地心引力)
展位号【H4-HT023】
【GRAVITY】是一家很科幻的公司,由一群硬核科幻迷创立,我们修炼引力,打破物理法则,实现虚空御物,对话不可实现、不可触摸的科幻。 我们首创空间自由悬浮技术群,研发【引力空间】系列科幻家居和【引力玩家】系列科幻潮玩产品,让用户可以真实触摸未来,体验现实科幻。
Voice AI Agent 知识库正式发布:打造你自己的语音智能体
在世界人工智能大会期间,Voice AI Agent 知识库 将正式和大家见面!
从零开始尝试语音 AI 的初学者?我们邀请你从这里开始,亲手搭建你的第一个语音智能体。
在这个知识库中,我们将一同学习 Voice Agent 背后的实时语音模型技术、创新产品场景和深度学习笔记。我们还可以参加 demo 展示和线上线下活动,一同探索 Voice Agent 的无限可能。
这里有最全的 STT 和 TTS 语音工具库,
以及最新的语音 AI 产品库
社区伙伴活动推荐
和 PPIO、Research AI+ 等社区伙伴一起拓展认知和社群的边界!
「WAIC AI 探索之旅」PPIO 与 TA 的朋友们组队搞事情啦!
研究者派对之夏
7 月 28 日晚,RTE 开发者社区也会出现在 Research AI+ 主办的研究者派对现场。欢迎来找我们聊聊!
这是 Research AI+ 的 Xinran 发来的邀请函:
在 WAIC 期间,我们想为研究者和技术爱好者们打造一个专属的「城市客厅」。我们相信,最好的交流发生在轻松、真实的氛围中,而非单向的 PPT 分享。
因此,我们告别了讲座,准备了能激发深度思想碰撞的「话题盲盒」圆桌和自由交流的派对。我们真诚地希望,每一位研究者和技术小伙伴都能在这里卸下白天的疲惫,轻松开启对话,结识志同道合的新朋友,进行一场真正愉悦、有深度的交流。已经有不少开发者社区和学术/产业研究员、工程师在这里啦!
欢迎添加 wx:germainecheung,请注明「报名活动」
彩蛋!留言评论抽门票
最后的彩蛋环节!
抽奖方式:7 月 23 日 15:00 前在公众号文章评论区留言,说说你最期待交流的展商项目或活动,附上一句话理由,就可以参与抽奖。
奖品:我们会在 23 日下午 18:00 前送出 WAIC 大会 4 日通票一张,价值 498 元。请注意评论区通知提醒,期待能在现场见到你~
加入我们的 Voice Agent 社区
RTE 开发者社区持续关注 Voice Agent 和语音驱动的下一代人机交互界面。如果你对此也有浓厚兴趣,也期待和更多开发者交流(每个月都有线上/线下 meetup,以及学习笔记分享),欢迎加入我们的社区微信群,一同探索人和 AI 的实时互动新范式。
加入我们:加微信 Creators2022,备注身份和来意(公司/项目+职位+加群),备注完整者优先加群。
GPT-4o 之后,Voice 从 Assistant 到 Agent,新机会藏在哪些场景里?|Voice Agent 学习笔记
对话 Wispr Flow 创始人 Tanay:语音输入,如何创造极致的 Voice AI 产品体验
Notion 创始人 Ivan Zhao:传统软件开发是造桥,AI 开发更像酿酒,提供环境让 AI 自行发展
ElevenLabs 语音智能体提示词指南——解锁 AI 语音交互的「灵魂秘籍」丨 Voice Agent 学习笔记
11Labs 增长负责人分享:企业级市场将从消费级或开发者切入丨Voice Agent 学习笔记
实时多模态如何重塑未来交互?我们邀请 Gemini 解锁了 39 个实时互动新可能丨Voice Agent 学习笔记
视频丨Google 最新 AI 眼镜原型曝光:轻量 XR+情境感知 AI 打造下一代计算平台
a16z 最新报告:AI 数字人应用层即将爆发,或将孕育数十亿美金市场
a16z合伙人:语音交互将成为AI应用公司最强大的突破口之一,巨头们在B2C市场已落后太多

