
开发者朋友们大家好:
01
社区活动推荐
1、今晚直播丨慢热的 MCP 终于火了:什么是 MCP,以及智能体通信协议的未来
⏰ 时间:今晚(周四) 20:00~21:15
📋 主题分享:什么是 MCP,以及智能体通信协议的未来
-
常高伟,ANP 开源技术社区发起人。
💻 圆桌对谈:打破 Agent 孤岛:Multi-Agent 系统和开源智能体协议
李国豪,CAMEL-AI.org 社区发起人
常高伟,ANP 开源技术社区发起人
-
林旅强,RTE 开发者社区主理人,开源社联创
02
有话题的技术
1、Google 推出开源多模态模型 Gemma 3
3 月 12 日,Google 正式推出新一代开源多模态模型 Gemma 3,该模型采用与 Gemini 2.0 相同的研发和技术,同时也是 Google 迄今为止最先进、最便携的开源模型。Google 介绍,Gemma 3 专为端侧设备设计:从手机和笔记本电脑到工作站,帮助开发者在任何需要的地方进行 AI 应用开发。
2、Open-Sora 2.0 全面开源,20 万复刻百万级大片!11B 媲美闭源巨头,224 张 GPU 创奇迹
动作幅度可控:可根据需求设定运动幅度,以更好地展现人物或场景的细腻动作。
画质与流畅度:提供 720p 高分辨率和 24 FPS 流畅视频,让最终视频拥有稳定帧率与细节表现。
-
丰富场景切换:从乡村景色到自然风光场景,Open-Sora 2.0 生成的画面细节与过渡平滑度都有出色的表现。(@新智元)
3、蚂蚁医疗大模型拿下 MedBench 测评「双料」冠军,支持图、文、音视频等多模态交互
5、阿里开源全模态模型,可充分理解音频信息、判断人物的情绪
MAFW-DFEW-SFT:生气
03
有亮点的产品
1、理想同学网页版正式上线
3 月 12 日,理想汽车旗下人工智能助手「理想同学」网页版正式上线,即日起,用户可在电脑端使用理想同学。理想同学网页版将与其手机 App 端协同构建跨场景智能服务生态。目前,理想同学网页版全面接入 DeepSeek R1 / V3 671B 满血版,问答支持切换选择 MindGPT-3o 模型、满血版 DeepSeek 模型,支持选择是否连接互联网进行搜索(MindGPT 模型下默认支持联网)。
2、智元机器人「灵犀 X2」:双足人形机器人新突破,支持语音、视觉等多种交互方式
3、阿里巴巴推出 AI 旗舰应用「新夸克」 全面升级为「AI 超级框」
新夸克的创新之处在于将 AI 对话、深度思考、深度搜索、深度研究和深度执行等功能整合到一个极简的「AI 超级框」中,一站式满足用户多样化的需求。与传统的对话式 AI 不同,夸克不仅能够进行智能对话,还能通过其智能中枢系统自动识别用户指令的意图,并进行深度思考、规划和执行,从而完成 AI 搜索、AI 写作、AI 生图、AI PPT 制作、学术研究、AI 搜题、AI 健康问答以及旅行计划等任务,实现不同场景下的问题解答与任务达成。(@AIbase 基地)
04
有态度的观点
1、阿里董事长:AI 市场规模至少 10 万亿美元
近日,阿里巴巴集团董事长蔡崇信出席由 CNBC 主办、在新加坡举办的 CONVERGE LIVE 论坛活动。蔡崇信在访谈中表示,人工智能未来可能会减少对分析师的需求,并认为分析师可能会被 AI 取代。其分析,AI 可以撰写一份英伟达或者苹果的报告,并且 AI 会完成得很出色。
加入我们的 Voice Agent 社区
RTE 开发者社区持续关注 Voice Agent 和语音驱动的下一代人机交互界面。如果你对此也有浓厚兴趣,也期待和更多开发者交流(每个月都有线上/线下 meetup,以及学习笔记分享),欢迎加入我们的社区微信群,一同探索人和 AI 的实时互动新范式。
加入我们:加微信 Creators2022,备注身份和来意(公司/项目+职位+加群),备注完整者优先加群。
端侧 AI 时代,每台家居设备都可以是一个 AI Agent丨Voice Agent 学习笔记
世界最炙手可热的语音 AI 公司,举办了一场全球黑客松,冠军作品你可能已经看过
多模态 AI 怎么玩?这里有 18 个脑洞
AI 重塑宗教体验,语音 Agent 能否成为突破点?
对话 TalktoApps 创始人:Voice AI 提高了我五倍的生产力,语音输入是人机交互的未来
a16z 最新语音 AI 报告:语音将成为关键切入点,但非最终产品本身(含最新图谱)
对话式 AI 硬件开发者都关心什么?低延迟语音、视觉理解、Always-on、端侧智能、低功耗……丨 RTE Meetup 回顾
2024,语音 AI 元年;2025,Voice Agent 即将爆发丨年度报告发布
对话谷歌 Project Astra 研究主管:打造通用 AI 助理,主动视频交互和全双工对话是未来重点
这家语音 AI 公司新融资 2700 万美元,并预测了 2025 年语音技术趋势
写在最后:

