大数跨境

刚刚,国产视频模型登顶全球第一!给谷歌Veo上了一课,还把钱给挣了

刚刚,国产视频模型登顶全球第一!给谷歌Veo上了一课,还把钱给挣了 新智元
2026-03-19
3

编辑:犀牛 KingHZ

【新智元导读】站在2026年春天回望,Sora浪潮之后,SkyReels V4以四位一体顶级能力(多模态参考+音视频联合生成+统一任务框架+全模态强化学习)登顶全球第一!AI视频创作的大一统时代正式开启。

国产视频生成模型首次站上世界最顶端。

第三方机构 Artificial Analysis 最新榜单显示,SkyReels V4 在「文本生成视频(含音频)」类别中位列全球第一,超越谷歌 Veo 3.1 与 Kuaishou Kling 3.0。

该榜单基于大规模真实用户盲评结果,非厂商自测数据,标志着中国在最具挑战性与商业价值的「文生视频+音频」赛道实现全面领先。

2月27日,SkyReels V4 Preview 首次亮相即获全球第二;不到一个月,V4 正式版登顶第一,完成关键跃迁。

SkyReels V4 不仅性能更强,更正在重构全球视频大模型竞争格局,标志着中国AIGC视频技术正式引领世界。

其API已开放(skyreels.ai),并将于2026中关村论坛正式发布。在「文本到视频(无音频)」单项中亦排名全球第二。

空谈数据不如直击能力。以下六大实测方向,展现全球第一视频AI的硬核实力。

AI短剧之王

SkyReels V4 是全球首个支持多模态输入(文本、图像、视频、音频)、音视频联合生成、统一生成/修复/编辑任务的视频基础模型,正推动昆仑万维天工AI向完整多模态视频系统升级。

AI短剧生成:两张图+一段台词,直出影院级短剧

输入两张角色图与一段台词,SkyReels V4 即可输出 1080p、32FPS、15秒视频,画面质感、角色表情、嘴型同步自然流畅,东西方面孔均表现优异。

雷鸣交加、风沙漫卷,关公秦琼展开史诗对决——从文字构思到音视频成品,零基础即可完成电影级内容创作,“想拍什么,就拍什么”成为现实。

关键突破在于:声音与画面同步生成,而非后期硬贴;人物口型与节奏精准匹配,彻底告别“AI味”。

多帧参考:九张图锁定角色与剧情一致性

支持最多9张关键帧输入,模型据此生成连贯的动作、镜头调度与场景过渡,有效解决长期困扰AI短剧的两大痛点:

  • 角色“换脸”——前一秒是尖下巴,后一秒变国字脸;
  • 场景跳脱——同一段剧情中突然切换空间背景。

此举大幅提升角色稳定性与叙事连贯性,使AI短剧真正具备“可追剧”品质。

提示词示例:「@图片-1的光背青年不断向前奔跑,期间会出现好几个拐角,镜头追踪;随后镜头切换至@图片-2,青年赤裸上半身继续奔跑并急转弯;随后切换至@图片-3,他露出诧异表情;最后切换至@图片-4,他向右拧动转盘,浓烟占据画面。」

此类高精度视频控制能力,配合统一视觉风格,让AI漫剧达到前所未有的自然度。

根据@图片-1动漫情节,按从上到下、从左到右顺序自然过渡生成动画短片。

打斗动作丝滑,特写切换合理;玄幻风格亦轻松驾驭。

一站式视频编辑:用嘴剪视频

SkyReels V4 不仅生成视频,更支持全流程智能编辑,覆盖三大核心能力:

第一类:添加元素

一句话指令即可将指定元素植入视频,如:“把@image_1中的蓝色针织冷帽,加到@video_1中央舞者头上”。各角度适配精准,效果自然逼真。

Add the blue ribbed knit beanie from @image_1 onto the head of the central dancer in @video_1.

第二类:重绑定角色动作

可将新角色无缝融入原视频场景,并精准复现/模仿原角色动作,甚至赋予夸张化、风格化演绎。

Add the colorful fursuit character from @image_1 into the urban dance scene in @video_1, placing them on the dance floor next to the dancer. The character should mirror the dancer's movements with a playful, exaggerated dance style.

第三类:智能清理

支持去除字幕、水印、台标、路人、动物等任意干扰元素,建立在对视频语义深度理解基础上,无需复杂工具链切换。

过去需在 Premiere、After Effects 及多款AI工具间反复操作的任务,如今由 SkyReels V4 单一模型统一完成。视频生成、补帧、延展、首尾插值、局部与全局编辑,全部收敛至同一通用接口与处理框架。

技术硬突破:为何能登顶全球第一?

SkyReels V4 的跃升并非小修小补,而是系统性攻克视频AI两大长期难题:

破解「画面好看但逻辑不通」

针对物理不合理(如水往天上流)、动作穿帮等现象,模型训练引入「全模态强化学习」机制:不仅评估画面还原度,更同步校验动作合理性、声画同步性及节奏一致性。

  • 画面要美,动作要准,声音要对口型、合节奏;
  • 任一维度不达标,即触发迭代重训。

团队还采用阶梯式课程强化学习,在分辨率与时长、任务复杂度、数据难度三个维度分阶段推进,持续提升高难度场景生成能力。

终结「角色记不住」

通过九宫格多帧参考机制,模型能稳定锁定角色面部特征、服装细节与场景风格,显著提升整部短剧的角色一致性和叙事连贯性,为AI短剧工业化生产奠定基础。

两项能力共同将视频生成的一致性与可控性推至行业新高度,SkyReels V4 已从“视频生成工具”进化为“短剧工业化生产引擎”。

技术报告已公开:arxiv.org/pdf/2602.21818

直面实践的检验:国产AI版Netflix已落地

技术成果已深度嵌入业务闭环。SkyReels V4 全面支撑昆仑万维旗下短剧平台 DramaWave。

DramaWave:昆仑万维的AI版Netflix

截至2026年1月,以 DramaWave 和 FreeReels 为核心的昆仑短剧平台,MAU 超8000万,年化流水(ARR)达4.8亿美元,月流水稳定在4000万美元以上——均为真实用户付费数据。

平台已上线AI自制剧近千部,月产能超30部;推出「百万美金・剧启 AI」全球创作者扶持计划,并同步上线AI短剧Agent工具 SkyAnime,全面提效。

例如AI短剧《掠夺词条!我转职为亡灵天灾》,依托 SkyAnime 制作,成本不足2万美元,单日投放超10万美元,累计播放量达数百万次,验证“技术→产品→商业化”闭环。

从「片段生成」迈向工业化全链路视频生产

SkyReels V4 解决了AI短剧最核心痛点——角色一致性。九宫格参考让角色贯穿始终,AI短剧品质首次达到“可以认真看”的水平,推动整个AI影视产业实现质的飞跃。

构建音画协同创作底座

昆仑万维同步布局AI音乐平台 Mureka,其O1模型为全球首个引入思维链(CoT)的音乐推理大模型,V8版本在音色、演奏技法与情感表达上持续突破,服务全球百余个国家用户。

SkyReels V4 视频能力 + Mureka 音乐能力,构成从画面到声音、从配乐到人声的全链路AI创作闭环。一家公司同时掌握全球顶尖视频与音乐大模型,属国际罕见。

品牌方一句话生成广告视频、独立音乐人一键生成MV、教育机构自动转化教学视频——这些不再是设想,而是正在规模化落地的应用场景。

All in AGI:昆仑万维的战略级爆发

回顾发展路径,SkyReels 系列演进体现清晰技术战略:

  • 2025年2月:开源 SkyReels-V1,中国首个面向AI短剧的视频生成模型,支持33种微表情与400+动作组合;
  • 2025年4月:发布 SkyReels-V2,全球首个采用扩散强迫(Diffusion Forcing)框架的无限时长电影生成模型;
  • 2026年1月:开源 SkyReels-V3,支持1–4张参考图像输入,实现多主体视频生成;
  • 2026年2月:SkyReels-V4 Preview 发布,Artificial Analysis 全球榜第二;
  • 2026年3月:SkyReels-V4 正式登顶全球第一。

每代迭代均聚焦补强一个关键短板,平均每3–4个月一次重大升级,节奏远超全球同行。

结合 Mureka 音乐大模型、Skywork 系列多模态推理模型、DramaWave 商业化平台,昆仑万维已建成覆盖「算力—模型—应用」的完整AI生态闭环,践行其自2023年初确立的「All in AGI 与 AIGC」战略。

AI视频创作的「大一统」时刻

从 Sora 引发的第一波浪潮,到 Veo、Kling、Seedance 等百花齐鸣,再到 SkyReels V4 凭借「全模态参考+音视频联合生成+统一任务框架+全模态强化学习」登顶全球——AI视频领域正迎来真正的“大一统”时刻。

创作门槛大幅降低,视频表达权回归大众。SkyReels V4 所代表的“一个模型、一次操作、端到端生成音视频成品”的技术路径,正是通往未来的最清晰通路。

昆仑万维已在技术报告中明确未来三大方向:拓展30秒以上长视频生成能力、增强实时交互式编辑功能、开放API与生态工具深度集成。每一项都将加速AI视频与专业影视制作的融合进程。

AI视频竞赛远未结束,但 SkyReels V4 以全球第一的成绩昭示:来自中国昆仑万维的技术力量,已站上世界之巅。

【声明】内容源于网络
0
0
新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
内容 15045
粉丝 0
新智元 智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
总阅读143.2k
粉丝0
内容15.0k