>

奥特曼飙河南话，小扎马斯克真人约架！豆包新模型把AI视频玩成「活人」

>

0

0



奥特曼飙河南话，小扎马斯克真人约架！豆包新模型把AI视频玩成「活人」

奥特曼飙河南话，小扎马斯克真人约架！豆包新模型把AI视频玩成「活人」

新智元

2025-12-18

6

【新智元导读】

字节跳动旗下火山引擎在FORCE大会上正式发布豆包视频生成模型Seedance 1.5 pro。该模型实现音画联合生成、多语言口型精准同步、影视级运镜与情绪表达，显著提升AI视频的叙事张力与工业可用性。

Seedance 1.5 pro核心升级

影视级叙事张力

Seedance 1.5 pro强化了微表情捕捉与镜头语言理解能力，可精准还原皱眉、咽口水、特写凝视等细节，支撑谍战、末世等强情绪题材的高质量生成。例如在“三体殖民地球”设定下，模型能细腻演绎罗辑压抑、悲伤的多层次情绪状态。

音画高精同步

模型采用原生音视联合生成（Native Audio-Visual Joint Generation）架构，摒弃“先视频后配音”的级联流程，实现毫秒级声画对齐。实测职场冷笑话场景、扎克伯格与马斯克八角笼对决等复杂音效动作均高度匹配。

多人多语言支持

支持中英粤川等多语种自然对白与口型同步，已验证四川话熊猫对话法国总统、大湾区方言短剧等案例。该能力显著提升短剧、喜剧及国风内容（如《牡丹亭》昆曲动画）的本土化表现力。

专业运镜+动态张力

优化运镜调度与高动态运动建模，可稳定生成蹦极临场感、恐怖片畸变走廊等高难度镜头。双分支扩散Transformer（MMDiT）结构使像素光影与声波震动同源协同，突破物理仿真上限。

产业级场景适配

已接入广告电商等实际业务流，支持奥特曼普通话代言香奈儿No.5等品牌定制内容。依托多阶段蒸馏技术，推理速度提升10倍，大幅降低算力门槛，加速落地短剧制作与创意一线。

技术突破：从默片到有声电影

Seedance 1.5 pro技术论文（arXiv:2512.13507）公开其底层创新：将音频与视觉信号视为同一数据的双面表征，实现玻璃碎裂声与画面同步诞生。该架构确立当前AI视频模型新基准，定义“八边形战士”能力维度。

Draft样片功能

即将上线Draft低分辨率预览模式（480p），支持关键元素确认后再生成1080p高清成片，最高节省60%推理成本，显著提升内容生产效率与性价比。

目前，个人用户可通过豆包APP、即梦AI体验Seedance 1.5 pro；企业用户可在火山方舟体验中心试用；API服务将于12月23日起在火山引擎平台正式上线。

【声明】内容源于网络

0

0

新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

内容 14611

粉丝 0

新智元智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

总阅读77.1k

粉丝0

内容14.6k