01
有话题的技术
1、蜜月期结束,微软自研 AI 模型
2、Llama 4 将在几周内推出改进的语音功能
02
有亮点的产品
1、联手 Perplexity,德国电信计划年内推出「AI 手机」
2、黑鲨魔戒 2 智能戒指发布:支持手势刷短视频,749 元
3、致敬未知推出全新 AI 智能运动眼镜,具备实时对讲、AI 自动成片等功能
4、硅基智能推出 HeyGen 开源替代品:HeyGem
5、Hedra 推出 Character-3:多模态 AI 数字人视频生成模型
Character-3 是由 Hedra 开发的一个 AI 数字人视频生成模型。它能够同时处理多种输入类型,包括图像、文本和音频,并通过联合推理生成更高质量的视频。
03
有态度的观点
1、Hugging Face 首席科学官:我们需要敢质疑的 AI
加入我们的 Voice Agent 社区
RTE 开发者社区持续关注 Voice Agent 和语音驱动的下一代人机交互界面。如果你对此也有浓厚兴趣,也期待和更多开发者交流(每个月都有线上/线下 meetup,以及学习笔记分享),欢迎加入我们的社区微信群,一同探索人和 AI 的实时互动新范式。
加入我们:加微信 Creators2022,备注身份和来意(公司/项目+职位+加群),备注完整者优先加群。
更多 Voice Agent 学习笔记:
世界最炙手可热的语音 AI 公司,举办了一场全球黑客松,冠军作品你可能已经看过
多模态 AI 怎么玩?这里有 18 个脑洞
AI 重塑宗教体验,语音 Agent 能否成为突破点?
对话 TalktoApps 创始人:Voice AI 提高了我五倍的生产力,语音输入是人机交互的未来
a16z 最新语音 AI 报告:语音将成为关键切入点,但非最终产品本身(含最新图谱)
对话式 AI 硬件开发者都关心什么?低延迟语音、视觉理解、Always-on、端侧智能、低功耗……丨 RTE Meetup 回顾
2024,语音 AI 元年;2025,Voice Agent 即将爆发丨年度报告发布
对话谷歌 Project Astra 研究主管:打造通用 AI 助理,主动视频交互和全双工对话是未来重点
这家语音 AI 公司新融资 2700 万美元,并预测了 2025 年语音技术趋势
语音即入口:AI 语音交互如何重塑下一代智能应用
写在最后:

