量子位 · QbitAI 记者:梦晨
字节跳动Seedance 2.0 AI视频生成技术团队在arXiv平台发布研究论文。
报告包含26页详实的评测基准及完整贡献者名单。
170位团队成员署名全部公开,充分体现对贡献者的尊重。
论文发布时间恰逢Seedance 2.0通过Byteplus平台面向全球推广。
100多个国家的企业客户可通过预付费API直接调用,支持文本、图像、视频、音频多模态输入,生成时长4至15秒、最高720p的MP4视频。
评测报告:技术实力全面领先
论文核心目标为解决AI视频生成在现实复杂场景中的应用瓶颈。
过去生成式工具依赖单一文本输入,难以在复用真实素材(品牌图片、配音、历史视频片段)时保持一致性,导致创作者面临迭代速度慢、输出不稳定等问题。
Seedance 2.0通过原生统一模型架构实现突破,能同步处理视频与音频生成,并支持文本、图像、视频、音频的综合输入解析。
-
多模态输入融合:文本、图像、视频、音频同步处理与内容整合 -
动作精准流畅:人物走路、跑步、打斗、舞蹈符合物理规律,多人互动自然稳定 -
音画同步优化:内置双耳立体声,实现口型、歌声、脚步声、背景音乐与画面严格匹配 -
智能导演功能:输入剧情文本可自动生成分镜头、运镜及剪辑节奏 -
灵活编辑支持:支持修改指定人物、动作或场景,实现在现有视频基础上的无缝续拍
评测覆盖VBench等主流基准,在质量、运动连贯性、语义一致性等维度实现全面量化对比。
Seedance 2.0位列行业第一梯队,多项指标显著超越同期竞争模型。
论文末页列出完整170人贡献者名单,与Seedance 1.5 Pro时期197人相比,近半年团队流动率达47%(89人离职、62人加入)。
团队核心成员包括吴永辉(现任字节跳动Seed团队基础研究负责人,直接向CEO梁汝波汇报)和曾妍(现任Seedance 2.0预训练负责人,驻美国帕洛阿尔托的技术执行骨干)。
最新动态:辟谣高薪招聘传闻
针对网传字节跳动斥资亿元招募前DeepSeek研究员郭达雅的消息,抖音副总裁李亮明确澄清属不实信息,强调Seed团队薪资体系统一,近期无亿元级年薪入职记录。
辟谣内容间接披露Seed团队薪酬结构:含现金、字节期权及豆包期权,分四年全额归属。
李亮特别补充:“若业务发展顺利,部分技术骨干四年后期权收益或达数亿元。”
此举被业内视为高端人才招募的间接举措。
论文地址:https://arxiv.org/abs/2604.14148
参考链接:
https://www.byteplus.com/en/activity/seedance2-0
[2] https://weibo.com/7965906915/QB6lMCaGo

