今天我们来关注 Google 推出的 AI 视频生成模型 Veo 2。
官方体验网址(集成在 AI Studio 中):
https://aistudio.google.com/generate-video
生成体验
我们尝试输入提示词“五一出行交通堵塞”,让 Veo 2 生成相关视频。系统提示预计需要 2 分钟。
视频生成完毕后的界面:
我们再尝试另一个提示词:“五一旅游景点人山人海”。
生成的效果如下:
初步评价
整体来看,生成的画面清晰度尚可,人物和场景具有一定的质感。但在部分细节性动态画面中,偶尔会出现轻微的模糊或不连贯现象。
补充知识:Google AI 视频生成模型 Veo 2 详解
一、核心功能与性能
高分辨率与长时长
-
原生支持生成高达 4K 分辨率 (4096×2160) 的视频,时长可达 2 分钟,在分辨率和时长上均显著优于早期模型(如 Sora)。 -
当前在实验工具 VideoFX 中,输出被限制为 720p 分辨率和 8 秒时长,但这不代表模型的原生能力。
多模态输入与物理模拟
-
支持文本提示或文本+参考图像生成视频。 -
能够模拟真实世界的物理现象,如流体动力学、光照效果等。 -
可较好地理解并实现复杂的镜头语言描述(如低角度跟踪、浅景深),并能一定程度上还原人类微表情和动作。
安全性与防滥用
-
内置 Google 的 SynthID 隐形水印技术,用于标记 AI 生成内容,确保可追溯性,防止滥用。
二、技术特点与创新
- 深度学习与生成对抗网络 (GANs):
利用深度学习分析海量数据,结合 GANs 等技术提升视频细节的真实感,减少伪影。 - 自然语言处理 (NLP):
能够理解复杂的自然语言指令,生成符合语义的视频内容。 - 多模态扩展能力:
支持结合图像、音频等多种模态的输入进行视频生成,提供更大的创作自由度。
三、应用场景
影视与广告
-
快速生成商业广告片、电影概念分镜、虚拟场景等,据称可大幅降低制作成本(相比传统特效制作)。 -
案例:广告片《Hands of Steel》据称完全由 Veo 2 制作,展示了其处理高动态场景的能力。
教育与社交媒体
-
制作科学实验模拟、历史场景重现等教育短片。 -
生成符合 TikTok、YouTube Shorts 等平台风格的创意短视频。
艺术创作
-
低成本实现艺术家想象中的奇幻场景或视觉概念。
四、定价与使用限制
成本结构
-
据报道,其潜在定价可能按秒计费,约为 0.5 美元/秒(即 30 美元/分钟),虽然远低于好莱坞特效成本,但对普通用户或小型项目仍可能较高。
当前限制
-
在公开的集成工具(如 Gemini Advanced)中,目前仅支持生成 8 秒 720p 视频,且有月度生成数量限制。 -
对于极其复杂或快速变化的场景(如激烈打斗),细节处理和连贯性仍有待提升。
五、集成与未来规划
现有整合
-
已集成到 Google One 的 Gemini Advanced 订阅服务中(需付费订阅)。 -
已集成到 Google Labs 的实验工具 VideoFX (原名 Whisk) 中。
技术迭代方向
-
持续优化长视频的连贯性和一致性,减少生成错误。 -
计划适配 Google 的 TPUv5 架构以降低推理成本。 -
计划扩展到更多 Google 产品和平台,如 YouTube Shorts。
六、优缺点总结
- 优势:
高分辨率输出、较好的物理模拟能力、多模态输入、对镜头语言的理解。 - 不足:
长视频连贯性有待提高、目前公开使用的版本限制较多、潜在使用成本可能较高。
需要更多免费AI工具、最新Ai信息、详细使用和丰富Ai教程、Ai变现方法的小伙伴可以加入 路上侠客的知识星球!
一年会员,原价199元,现在只需 99元!

