开发者朋友们大家好:
01
1、黑神话悟空也能用 AI 生成了?GameGen-X 颠覆游戏开发
2、首个会话音频开源模型 Hertz-dev 120 毫秒超低延迟惊艳全网
一个革命性的开源音频模型——Hertz-dev 横空出世,凭借其惊人的性能指标,让全球开发者为之震撼。这款拥有 85 亿参数的 AI 语音巨兽,通过 2000 万小时高质量音频数据的训练,成功实现了人类梦寐以求的全双工实时对话。
突破性全双工技术:彻底颠覆传统轮流发言模式,实现真正的双向实时交流
卓越音频压缩:在保证高音质的同时,大幅降低带宽占用
超长对话能力:轻松理解和生成持续性对话内容
-
革命性低延迟:120 毫秒的响应速度,开创实时互动新纪元
作为一个专注音频的 Transformer 基础模型,Hertz-dev 在训练过程中充分利用了真实世界的对话数据,成功捕捉了人类语音中的细微特征,包括自然的停顿节奏和丰富的情感语调变化。
3、字节推出单图视频驱动模型 X-Portrait 2:一键生成相同表情神态,简化创作流程
单图视频驱动技术,即只需一张静态照片和一段驱动视频,即可生成高质量、「电影级」的视频。
4、苹果 Siri AI 进化:将支持读取屏幕、摘要内容、回答相关问题
5、原美团联合创始人回归,将探索 AI 应用
1、前 OpenAI 研究员:需要保护那些脆弱但极具价值的想法

