大数跨境
0
0

Whisk中免费使用Google最新Imagen 4图片模型

Whisk中免费使用Google最新Imagen 4图片模型 路上侠客
2025-06-17
0
导读:今天我们来体验 Google Labs 中的 Whisk (现已更名为 ImageFX),它允许用户免费使用

今天我们来体验 Google Labs 中的 Whisk (现已更名为 ImageFX),它允许用户免费使用 Google 最新的 Imagen 3 (甚至可能是 Imagen 4 的部分能力) 模型进行图片和短视频生成。

官方体验网址:https://labs.google/fx/zh/tools/whisk (可能重定向到 ImageFX)

ImageFX 一次通常会生成 4 张图片供用户选择。

生成 AI 绘画提示词

为了充分发挥 Imagen 模型的潜力,一个好的提示词非常重要。我们可以使用“路上侠客”定制的 AI 绘图提示词工具来辅助生成高质量的提示词。

提示词生成工具链接:https://roadheroai.com/veo2视频提示词生成器/

生成提示词后,点击复制即可。

使用中文提示词测试 ImageFX

我们将生成的中文提示词输入到 ImageFX (Whisk) 中进行图片生成。示例提示词:

“一个关于“一个成了精的粽子”的视频,主要内容是“在人间的街道上闲逛”。 视觉风格:电影感。 场景设定在繁华的夜市。 主要动作为“探索与发现”。 镜头类型包括:广角镜头。 摄影机运动有:跟镜头, 无人机视角。 拍摄角度可采用:鸟瞰视角。 光照和氛围:霓虹闪烁的都市夜景。 色彩风格:梦幻般的柔和色彩。 宽高比:9:16竖屏。”

ImageFX 生成的图片效果:

细节图:

生成动态视频 (短动画)

ImageFX (Whisk) 还支持基于静态图片生成短时动态视频(GIF 或 MP4),免费用户可能有次数限制(例如 10 次)。

基于上述图片,输入动态化提示词:“粽子在向前跳跃,人群在动”。

除了导出视频,还可以导出 GIF 动图格式。

中文与英文提示词效果对比

测试发现,使用中文提示词时,ImageFX (Imagen 3/4) 的生成效果与预期可能有较大偏差,这可能是由于模型对中文复杂语义的理解尚有不足。作为对比,使用相同的核心概念,在“即梦”等国内模型中生成的图片效果可能更佳。

即梦使用相同中文提示词生成的图片:

即梦使用相同中文提示词生成的视频截图:

为了进一步验证,我们尝试使用纯英文提示词在 ImageFX (Whisk) 中生成图片:

“Surreal hyperrealistic shot from an FPV ACTION CAMERA POV darting through a chaotic American football game. Humans and massive gorillas, helmets strapped awkwardly, clash on the same field under blistering stadium lights. The camera weaves between pounding cleats and fists. A gorilla barrels through a line, cradling the ball, tossing it overhead. Sweat and dirt fly. Filmed in 16mm film.”

英文提示词生成的图片效果:

细节图:

可以看到,使用英文提示词时,ImageFX 的生成效果明显提升,更符合预期。

再基于此英文图片生成动态视频,动态化提示词:“猩猩动起来,人也动起来,灯光闪烁”。

补充知识:Google Imagen 4 (或 Imagen 3 持续迭代) 介绍

基本信息

Imagen 4 是 Google DeepMind 在 2025 年 5 月 21 日的 Google I/O 2025 开发者大会上重点介绍的最新一代文生图 AI 模型 (此前的 Imagen 3 也在持续迭代和能力增强中)。这些模型进一步巩固了谷歌在生成式 AI 领域的领先地位。

(注:行业内对 Imagen 的版本号有时存在混用,ImageFX 工具可能基于 Imagen 3 的最新版本或 Imagen 4 的早期能力。)

性能提升

  • 生成速度:
     Imagen 4 号称比上一代(可能指早期 Imagen 3 版本)快 10 倍,显著提高图像生成效率。
  • 图像质量:
     生成的图像更精致,细节更丰富,AI 生成痕迹更少,效果更接近真实、自然。

功能特点

  • 文本渲染能力:
     能够更好地在图像中生成文字,并进行合理的排版设计,这对于制作海报、广告等图文结合的设计非常有价值。
  • 高分辨率与细节:
     支持生成高达 4K 分辨率的图像,细节表现出色。
  • 多样性与语义理解:
     支持多样化的主题和艺术风格,能较好地理解复杂的文本描述并将其转化为视觉图像。
  • 跨平台兼容性:
     通过 ImageFX 等工具,用户可以在电脑和移动设备上使用。
  • 潜空间扩散模型架构:
     采用先进的潜空间扩散模型,有助于在保持图像细节的同时生成高分辨率、高清晰度的图像,并能更好地处理复杂文本提示,探索更多创新视觉路径。

使用限制

  • 尽管 Imagen 模型通过 ImageFX 等工具向所有 Gemini 用户开放,但免费账户用户在使用时可能无法生成包含可识别人物的图像。
  • Gemini Advanced、Business 或 Enterprise 等付费版本的用户才能享受完整的功能,包括更自由的人物图像生成。

应用场景

  • 广告与市场营销素材创作
  • 创意艺术与设计
  • 动画与电影概念设计
  • 教育内容视觉化

重要提示: 对于中文用户,目前使用英文提示词在 ImageFX (Imagen 3/4) 中通常能获得比中文提示词更理想的生成效果。这可能与模型在不同语言上的训练数据量和语义理解深度有关。

需要更多免费AI工具、最新Ai信息、详细使用和丰富Ai教程、Ai变现方法的小伙伴可以加入 路上侠客的知识星球

一年会员,原价199元,现在只需 99元

【声明】内容源于网络
0
0
路上侠客
谈讨、研究、实践AI智能和跨境电商之间的联系和应用。旨在和科技浪潮对冲时产生一些火花,提高工作效率。网站:www.roadheroai.com
内容 818
粉丝 0
路上侠客 谈讨、研究、实践AI智能和跨境电商之间的联系和应用。旨在和科技浪潮对冲时产生一些火花,提高工作效率。网站:www.roadheroai.com
总阅读325
粉丝0
内容818