1、第一个开源的具有实时对话能力的多模态模型:Mini-Omni
实时语音到语音的对话能力:无需额外的 ASR 或 TTS 模型
边思考边说话:能够同时生成文本和音频
流式音频输出:支持流式音频输出
-
「Any Model Can Talk」 方法:Mini-Omni 可以将语音交互能力添加到其他模型中,为其他模型赋能(@PaperAgent)
2、谷歌 DeepMind 展示 GenRM 技术:微调 LLMs 作为奖励模型,提升生成式 AI 推理能力
无缝集成指令调整
支持思维链推理
-
通过多数投票利用额外的推理时间计算
3、谷歌 AI 推出 CardBench 评估框架:含 20 个真实数据库,更全面评估基数估计模型
4、狨猴会用名字称呼彼此
5、Cursor 开源平替:AI 编程工具 Melty 让编程效率提升 10 倍
1、A16z 投资者 Joshua Lu:AI 正在颠覆视频游戏行业,Discord 是未来
当生成模型足够快时,实时互动视频游戏就将到来——A16Z 最新报告:下一代皮克斯,AI 会如何融合电影和游戏?
小智正在寻找技术和投资人啦!
项目目标:我们的目标是打造全球每一位独立旅行者的强大 AI 助手-小智旅游助手,通过提供个性化、陪伴式的旅行支持,引领 AI 旅游领域,给个人旅行者提供更加温馨、懂你的服务。
项目创意-已实现功能:
-
We are looking for:
技术人才:我们正在寻找具备前沿技术研发能力的优秀技术人才,尤其是在人工智能、机器学习、大数据处理等领域有丰富经验的专业人士。
技术合作:欢迎其他技术团队与我们开展技术合作,共同开发新的功能模块,优化现有技术方案,或整合双方的技术资源,以实现技术上的突破和创新。
战略投资方:我们正在寻找有志于支持创新技术发展的战略投资方,以推动项目的进一步发展和市场拓展。我们期待与能够提供资金支持和战略指导的投资者合作,共同推动项目成功。
-
更多信息&联系方式:《小智正在寻找技术和投资人啦!We are looking for IT and investors!》
我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

