大数跨境
0
0

刚刚,谷歌深夜上新Veo 3.1!网友狂刷2.75亿条,Sora 2要小心了

刚刚,谷歌深夜上新Veo 3.1!网友狂刷2.75亿条,Sora 2要小心了 极市平台
2025-10-16
1

↑ 点击蓝字 关注极市平台
作者丨新智元
来源丨新智元
编辑丨极市平台

极市导读

 

谷歌凌晨发布Veo 3.1,主打首尾帧生成、音画同步与多图合成,已接入Gemini API与Flow平台,实测叙事连贯性提升但物理细节仍露馅,被评“小升级”等年底大招。>>加入极市CV技术交流群,走在计算机视觉的最前沿


刚刚,谷歌在今天凌晨更新了旗舰视频生成模型Veo 3.1

此次更新主要有两大功能亮点:

  • 更强的叙事与音频控制

  • 更丰富的输入与编辑能力

这次升级让AI对想讲述的故事能有更深的理解

Veo 3.1让AI视频生成迈入「导演级」精控阶段

真实与叙事感升级,更高画质与音画同步,让视频更具电影质感。

Veo 3.1目前已接入Gemini APIVertex AI

普通用户也可以直接在Flow或者Gemini中体验。

Flow使用方式如下
,新建项目后即可使用。

Gemini可选择创建Video,即可使用Veo 3.1。

我们使用「威尔斯吃面」极简提示词测试了一下效果,确实已经非常流畅和自然。

对于首尾帧生成,我们也进行了测试,提示词为「奥特曼最后像钢铁侠一样飞走」。

效果也非常好。

Veo 3.1可以将不同人物和物体的照片合成一个完整的场景,并配有声音。

还能创建更长的片段,甚至持续一分钟或更久,延续原始镜头中的动作。

每个生成的视频都基于前一个片段的最后一秒,以帮助延续故事,并保持背景和人物的一致性。

只需提供第一帧和最后一帧,Veo就会让整个场景栩栩如生,创建带有宏大转场的无缝视频。

强推使用Flow来使用和体验Veo 3.1!

5个月前,谷歌正式推出Flow,一款由Veo驱动的AI电影制作工具。

目前,谷歌宣称用户已在Flow中生成了超过2.75亿个视频

此次Veo 3.1的更新,推出了用于剪辑编辑的新功能和增强创意能力。

Flow还有一个Flow TV的功能,像一个电视台一样,可以不断地换台,观看其他用户生成的创意视频。

Flow TV工作台可以通过工作台进行切换。

Flow将2.5亿个视频,分成了不同的频道。

比如碰撞测试、打招呼、感到可爱。。。等等。

而Short Films则是用户制作的微电影,制作更加精良,时间更长。

目前只放出了3部。

比如下面这部名为「FreeLancers」,讲述了这样一个故事:
在纽约一家秘密餐厅的晚餐中,两位久疏音信的养兄弟——一位做事谨慎、另一位喧闹且卤莽——回忆起他们作为国际杀手的职业生涯,直到他们意识到两人竟被雇佣去执行同一项任务:对方。
「FreeLancers」电影级别视频如下,电影质感非常高。

Veo 3.1技术规格上支持输出720p或1080p分辨率的视频,帧率为24帧/秒(fps)。

视频时长可选4秒、6秒或8秒,若使用Extend功能,视频最长可扩展至148秒。

各位觉得Veo 3.1的效果能不能打过Sora 2呢?

这次的Veo 3.1更像「功能小升级」——新增首尾帧、多图参考等控制。

但成片质感较Veo 3进步有限,甚至略微显得有点「假」。

原生时长仍只有8秒,Flow延长至30秒画面偶有衔接,音频提升其实很一般。

基础物理表现比过去好些,但一遇到人物表演与复杂调度还是会露馅。

但这个只是Veo 3->Veo 3.1的一次微调。

期待一下谷歌年底的大招,估计会配合Gemini 3全家桶发布。

参考资料:
https://x.com/GoogleDeepMind/status/1978491999029219364



公众号后台回复“数据集”获取100+深度学习各方向资源整理

极市干货

技术专栏:多模态大模型超详细解读专栏搞懂Tranformer系列大视觉模型 (LVM) 解读扩散模型系列极市直播
技术综述:小目标检测那点事大模型面试八股含答案万字长文!人体姿态估计(HPE)入门教程

点击阅读原文进入CV社区

收获更多技术干货

【声明】内容源于网络
0
0
极市平台
为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
内容 8155
粉丝 0
极市平台 为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
总阅读3.2k
粉丝0
内容8.2k