字节大模型两年跃升记:全栈布局、人才密度与长期主义
自2023年初重启大模型研发以来,字节跳动以“all in”姿态推进模型层、中间层与应用层的全栈布局,通过饱和式投入与低价策略,在两年内实现从行业追随者到国内领先者的跨越式发展。公司不仅探索AI时代的新型交互方式与流量入口,更着眼于AI对短视频主业的赋能及新业务增长点的孵化[k]。
1.1 基础模型:快速迭代补位,多模态能力全球领先
经过2023至2024年的密集迭代,字节大模型已构建起系列化产品体系,整体能力稳居国内第一梯队。其语言模型Seed-Thinking-v1.5在2025年4月发布后,使国内与国际前沿水平差距缩短至3个月内,一度超越同期DeepSeek R1模型[k]。
在多模态领域,字节表现尤为突出。文生图模型Seedream 3.0曾登顶全球榜单,目前位列第二,仅次于GPT-4o;视频生成模型Seedance 1.0于2025年4月上线后位居全球第一。语音合成能力亦在国内测评中排名第一(SuperClue-TTS)[k]。依托抖音生态积累的海量音视频数据,字节在多模态AI应用场景中具备显著优势,有望形成“技术—场景—数据—产品”的正向循环[k]。
从2023年初启动Seed项目起,字节持续补全语言、图像、音频、视频等模态能力。2023年8月发布云雀大模型V1.0,2024年5月推出豆包大模型系列(含通用模型Pro/Lite及7款功能模型),同年9月上线视频生成模型,12月升级视觉理解模型,2025年相继发布豆包1.5系列与1.6系列,保持高频迭代节奏[k]。
1.2 研发架构:高人才密度+赛马机制,聚焦长期AGI探索
字节大模型的快速突破得益于高密度顶尖人才与内部竞争机制。Seed团队汇聚了冯佳时(视觉)、王雨轩(语音)等内部资深专家,以及吴永辉(前Google DeepMind副总裁)、周畅(原阿里通义技术负责人)等外部技术领袖。2024年启动“Top Seed”计划,招募约30名顶尖应届博士,强化研发梯队[k]。
团队采用“赛马机制”推动创新,如视频生成方向由PixalDance与Seaweed两支团队并行研发,激发技术突破[k]。AI业务在集团内层级极高,Seed与Flow团队负责人直接向CEO梁汝波汇报,地位与抖音、飞书等核心业务并列。原抖音CEO张楠、飞书副总裁齐俊元等高管转岗AI部门,凸显战略优先级[k]。
2025年,字节调整AI架构,引入吴永辉主抓基础研究,朱文佳聚焦模型应用,形成“双负责人”模式。吴永辉统领基础模型、AML、AI Lab等团队,推动底层技术创新;朱文佳负责问答、创作、代码等用户体验相关能力,实现技术与应用协同[k]。
字节于2025年1月设立“Seed Edge”长期研究项目,整合AI Lab下的Seed Robotics、AI for Science、Responsible AI等方向,专注AGI前沿探索。该项目不设OKR与半年考核,考核周期更长,强调长期价值。同时设立虚拟小组,简化汇报层级,职级为“吴永辉-2”者可直接汇报,提升组织效率[k]。
1.3 资本投入:AI开支持续加码,国内投入位居首位
在全球AI资本开支持续上升的背景下,字节跳动在大模型领域的投入位列国内第一,支撑其长期技术领先战略[k]。
(报告来源:东方证券。本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

