【新智元导读】
字节跳动旗下火山引擎在FORCE大会上正式发布豆包视频生成模型Seedance 1.5 pro。该模型实现音画联合生成、多语言口型精准同步、影视级运镜与情绪表达,显著提升AI视频的叙事张力与工业可用性。
Seedance 1.5 pro核心升级
影视级叙事张力
Seedance 1.5 pro强化了微表情捕捉与镜头语言理解能力,可精准还原皱眉、咽口水、特写凝视等细节,支撑谍战、末世等强情绪题材的高质量生成。例如在“三体殖民地球”设定下,模型能细腻演绎罗辑压抑、悲伤的多层次情绪状态。
音画高精同步
模型采用原生音视联合生成(Native Audio-Visual Joint Generation)架构,摒弃“先视频后配音”的级联流程,实现毫秒级声画对齐。实测职场冷笑话场景、扎克伯格与马斯克八角笼对决等复杂音效动作均高度匹配。
多人多语言支持
支持中英粤川等多语种自然对白与口型同步,已验证四川话熊猫对话法国总统、大湾区方言短剧等案例。该能力显著提升短剧、喜剧及国风内容(如《牡丹亭》昆曲动画)的本土化表现力。
专业运镜+动态张力
优化运镜调度与高动态运动建模,可稳定生成蹦极临场感、恐怖片畸变走廊等高难度镜头。双分支扩散Transformer(MMDiT)结构使像素光影与声波震动同源协同,突破物理仿真上限。
产业级场景适配
已接入广告电商等实际业务流,支持奥特曼普通话代言香奈儿No.5等品牌定制内容。依托多阶段蒸馏技术,推理速度提升10倍,大幅降低算力门槛,加速落地短剧制作与创意一线。
技术突破:从默片到有声电影
Seedance 1.5 pro技术论文(arXiv:2512.13507)公开其底层创新:将音频与视觉信号视为同一数据的双面表征,实现玻璃碎裂声与画面同步诞生。该架构确立当前AI视频模型新基准,定义“八边形战士”能力维度。
Draft样片功能
即将上线Draft低分辨率预览模式(480p),支持关键元素确认后再生成1080p高清成片,最高节省60%推理成本,显著提升内容生产效率与性价比。
目前,个人用户可通过豆包APP、即梦AI体验Seedance 1.5 pro;企业用户可在火山方舟体验中心试用;API服务将于12月23日起在火山引擎平台正式上线。

















