大数跨境
0
0

奥特曼飙河南话,小扎马斯克真人约架!豆包新模型把AI视频玩成「活人」

奥特曼飙河南话,小扎马斯克真人约架!豆包新模型把AI视频玩成「活人」 新智元
2025-12-18
6

【新智元导读】

字节跳动旗下火山引擎在FORCE大会上正式发布豆包视频生成模型Seedance 1.5 pro。该模型实现音画联合生成、多语言口型精准同步、影视级运镜与情绪表达,显著提升AI视频的叙事张力与工业可用性。

Seedance 1.5 pro核心升级

影视级叙事张力

Seedance 1.5 pro强化了微表情捕捉与镜头语言理解能力,可精准还原皱眉、咽口水、特写凝视等细节,支撑谍战、末世等强情绪题材的高质量生成。例如在“三体殖民地球”设定下,模型能细腻演绎罗辑压抑、悲伤的多层次情绪状态。

音画高精同步

模型采用原生音视联合生成(Native Audio-Visual Joint Generation)架构,摒弃“先视频后配音”的级联流程,实现毫秒级声画对齐。实测职场冷笑话场景、扎克伯格与马斯克八角笼对决等复杂音效动作均高度匹配。

多人多语言支持

支持中英粤川等多语种自然对白与口型同步,已验证四川话熊猫对话法国总统、大湾区方言短剧等案例。该能力显著提升短剧、喜剧及国风内容(如《牡丹亭》昆曲动画)的本土化表现力。

专业运镜+动态张力

优化运镜调度与高动态运动建模,可稳定生成蹦极临场感、恐怖片畸变走廊等高难度镜头。双分支扩散Transformer(MMDiT)结构使像素光影与声波震动同源协同,突破物理仿真上限。

产业级场景适配

已接入广告电商等实际业务流,支持奥特曼普通话代言香奈儿No.5等品牌定制内容。依托多阶段蒸馏技术,推理速度提升10倍,大幅降低算力门槛,加速落地短剧制作与创意一线。

技术突破:从默片到有声电影

Seedance 1.5 pro技术论文(arXiv:2512.13507)公开其底层创新:将音频与视觉信号视为同一数据的双面表征,实现玻璃碎裂声与画面同步诞生。该架构确立当前AI视频模型新基准,定义“八边形战士”能力维度。

Draft样片功能

即将上线Draft低分辨率预览模式(480p),支持关键元素确认后再生成1080p高清成片,最高节省60%推理成本,显著提升内容生产效率与性价比。

目前,个人用户可通过豆包APP、即梦AI体验Seedance 1.5 pro;企业用户可在火山方舟体验中心试用;API服务将于12月23日起在火山引擎平台正式上线。

【声明】内容源于网络
0
0
新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
内容 14611
粉丝 0
新智元 智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
总阅读77.1k
粉丝0
内容14.6k