
01
有话题的技术
1、OpenAI 最大最贵的模型,GPT-4.5 发布
知识更广泛:它学习了更多的信息,所以懂的东西比以前多
更少胡说八道:减少了「幻觉」(就是 AI 编造事实的情况)
更懂人心:「情商」更高,更能理解你的真实意图
对话更自然:聊天感觉更像和真人交流,不那么机械
-
创意更丰富:在写作和设计方面表现更好从今天开始,ChatGPT Pro 用户已经可以用上 GPT-4.5(研究预览版)了。
2、Kimi 新模型 k1.6 曝光,代码生成能力超越 GPT o3-mini
3、语音合成也遵循 Scaling Law,太乙真人「原声放送」讲解论文 ,港科大等开源
活久见,太乙真人给讲论文了。
4、腾讯推出新一代快思考模型混元 Turbo S
5、Meta 无预警发布新一代 AI 眼镜,专为 AI 和机器人研究打造
-
顶尖传感器阵列:升级后的传感器系统包含 RGB 摄像头、六自由度 SLAM 摄像头、眼动追踪摄像头、空间麦克风、惯性测量单元(IMU)、气压计、磁力计及全球导航卫星系统(GNSS)。相较于前代,本代创新性在鼻托处嵌入了两大传感器:用于心率监测的光电容积描记(PPG)传感器,以及可区分佩戴者与周围人声的接触式麦克风。 -
超低功耗设备端机器感知处理:SLAM、眼动追踪、手势识别及语音识别均由 Meta 定制芯片在设备端完成计算。 -
全天候使用体验:支持 6-8 小时持续运行,整机重量约 75 克,配备可折叠镜腿提升便携性。 -
音频交互系统:通过行业领先的开放式主动降噪扬声器提供音频反馈,支持用户参与式系统原型开发。(@三次方 AIRX)
02
有亮点的产品
1、Lingo.dev :一款能在几分钟内将应用翻译成多种语言的 AI 本地化引擎
https://lingo.dev/zh
AI 驱动的翻译引擎,能够理解 UI 元素的位置和微观上下文;
开发者友好的设计,提供 API 和 SDK 支持;
自动化的拉取请求功能,无缝集成到开发流程中。
与传统翻译服务相比,Lingo.dev 的差异化优势在于其对开发环境的深度理解和集成,以及 AI 技术带来的高效率和准确性。
-
用户体验方面,产品提供了 1000 美元的免费额度,让用户可以轻松尝试和评估服务质量。(@ Z Potentials)
2、Figure 机器人加速进军家庭场景 2025 年启动 Alpha 测试挑战行业极限
3、Fleet AI Copilot :一款简化 IT 生活的 AI 驱动 IT 助手聊天机器人
个性化支持,根据用户需求提供定制化服务;
集中化运营,整合 IT 管理流程;
自适应能力,能够根据用户需求不断优化。与传统 IT 管理工具相比,Fleet AI Copilot 的差异化优势在于其 AI 驱动的智能化和自动化能力,能够显著提升 IT 运营效率。(@ Z Potentials)
03
有态度的观点
1、DeepMind 首席科学家:「慢思考」模式将能提升 AI 性能
04
Real-time AI Demo 分享
1、通过手势识别让 Gemini 分析环境视觉信息
Google Creative Lab 的 Tina 使用 Gemini 2.0 Flash 和 Mediapipe 构建了一个将手变成木偶的实验。通过检测手何时张开+实时捕获网络摄像头图像,Gemini 分析所处环境并生成情境感知的思考。将提示调整为仅关注颜色,木偶的回答立即更新:
(@ Tina Tarighian@X)
加入我们的 Voice Agent 社区
RTE 开发者社区持续关注 Voice Agent 和语音驱动的下一代人机交互界面。如果你对此也有浓厚兴趣,也期待和更多开发者交流(每个月都有线上/线下 meetup,以及学习笔记分享),欢迎加入我们的社区微信群,一同探索人和 AI 的实时互动新范式。
加入我们:加微信 Creators2022,备注身份和来意(公司/项目+职位+加群),备注完整者优先加群。
更多 Voice Agent 学习笔记:
多模态 AI 怎么玩?这里有 18 个脑洞
AI 重塑宗教体验,语音 Agent 能否成为突破点?
对话 TalktoApps 创始人:Voice AI 提高了我五倍的生产力,语音输入是人机交互的未来
a16z 最新语音 AI 报告:语音将成为关键切入点,但非最终产品本身(含最新图谱)
对话式 AI 硬件开发者都关心什么?低延迟语音、视觉理解、Always-on、端侧智能、低功耗……丨 RTE Meetup 回顾
2024,语音 AI 元年;2025,Voice Agent 即将爆发丨年度报告发布
对话谷歌 Project Astra 研究主管:打造通用 AI 助理,主动视频交互和全双工对话是未来重点
这家语音 AI 公司新融资 2700 万美元,并预测了 2025 年语音技术趋势
语音即入口:AI 语音交互如何重塑下一代智能应用
写在最后:

