当地时间 12 月 16 日,谷歌旗下人工智能研究室 Deepmind 推出了全新升级的 AI 视频模型 Veo 2 和图像生成模型 Imagen 3。
Veo 是谷歌 Deepmind 团队打造的类 SORA 视频模型。Veo 2 模型能够生成最高 4K 分辨率、时长达到 2 分钟的视频片段,相较于 OpenAI 近日正式上线的 SORA 模型,分辨率提升 4 倍,时长提升 6 倍,直接吊打。

根据官博文章介绍,新一代的 Veo 2 带来了多项重要突破:
支持生成分辨率达 4K 的视频
能够读懂用户提示词里边的运镜专业用词,比如针对摄像机视角的控制,如“广角”“第一人称”和“无人机拍摄”等等
更真实地模拟物理现象和人类表情
相比其他 AI 视频模型经常容易出现的 BUG 问题,比如多余的手指或者物体,Veo 2 显著降低了出现错误的频率
我们来看几个案例:
此外,谷歌还针对旗下 Imagen 3 图像生成模型进行了全面升级。

