大数跨境
0
0

Nano Banana Pro 正式发布,官方信息全整理

Nano Banana Pro 正式发布,官方信息全整理 赛博禅心
2025-11-20
2
导读:最好、最新的内容,总来自赛博禅心

先让我插入几个巨牛逼的例子,都是来源上一篇的评论区:BananaPro 已发布,可通过 API & 第三方使用






本文全部信息,来自谷歌官方


今天,Nano Banana Pro 正式发布(不叫 Banana2


这东西,可通过 Google AI Studio 中的 Gemini API 和企业级 Vertex AI 平台,构建新一代智能多模态应用。该模型能解锁高保真图像,在文本渲染方面具有更高准确性,并拥有强大的世界知识

Gemini 3 Pro Image 在文本到图像 AI 基准测试中表现出色。

Gemini 3 Pro Image excels on Text to Image AI benchmarks


核心能力概览

1. 高保真度与专业级控制

对于需要高精度的专业工具,Nano Banana Pro 提供了对物理效果(如光照、相机、焦点、色彩分级)和图像构图的精细控制,确保输出达到专业品质。模型支持 2K 和 4K 分辨率,满足专业制作的清晰度标准。此外,它支持强大的局部编辑功能,例如替换体积光为散景效果。

一个在金色散景和晨雾中迷失的剪影。

Prompt: Replace volumetric lighting with bokeh

在图像合成方面,Nano Banana Pro 可以轻松地将产品图片、标志和参考图等多种元素组合成连贯的广告。它能在一个合成图像中保持多达 5 个人的面部一致性,或融合最多 6 张高保真照片及 14 个标准输入。

通过增强的创意能力,您可以将草图转化为产品,或将蓝图变为逼真的 3D 结构,轻松地将期望的视觉风格应用于模型,确保品牌在每个触点上保持无缝和一致。

Prompt: Combine these images into one appropriately arranged cinematic image in 16:9 format and change the dress on the mannequin to the dress in the image

2. 改进的文本渲染与本地化

与 2.5 Flash Image 相比,Nano Banana Pro 在文本渲染方面实现了显著飞跃,能够生成清晰、准确的嵌入文本,无论是短标语还是长段落。它擅长处理逻辑和语言,可生成包含多种纹理、字体和书法风格的文本,将抽象的图像生成转变为功能性资产,非常适合制作营销材料、教育内容等。

创意美食摄影,每个单词都用相关的食材艺术性地拼写出来。

Prompt: Make 8 sophisticated minimalistic logos, each is a fun food word, and make letters from realistic food to express the meaning of this word. composition: a rendering of all logos on a single solid white background

模型还打破了图像生成与本地化逻辑之间的壁垒。凭借 Gemini 的多语言推理能力,它能理解图像的语义上下文,轻松地对菜单、标志或文档上的元素进行多语言文本生成或翻译,同时保持原有的艺术风格和布局。

一个饮料广告概念,展示了将英文文本准确翻译和渲染为法文的能力。

Prompt: Translate to French

3. 联通世界知识与实时信息

基于 Gemini 3 Pro 的 Nano Banana Pro 连接了庞大的知识库,能够生成比以往模型更具事实性的内容。启用后,通过 Google 搜索进行 grounding,可将模型与实时网络内容连接,实现数据驱动的输出。这对于需要精确表示的应用(如生物图解、历史地图或实时天气信息图表)尤其有价值。你可以用它来创建关于任何主题的定制化信息图表。

Prompt: Create an infographic about this plant focusing on interesting information.

Prompt: Create an infographic about this plant focusing on interesting information.


如何体验 Nano Banana Pro

  • 消费者和学生:
     在 Gemini 应用中选择“创建图像”并使用“思考”模型,即可在全球范围内使用。免费用户将有有限的免费配额,之后会恢复为原版 Nano Banana 模型。Google AI Plus, Pro 和 Ultra 订阅者将获得更高的配额。
  • 专业人士:
     Google Ads 中的图像生成功能已升级至 Nano Banana Pro。它也已开始向 Workspace 用户的 Google Slides 和 Vids 中推出。
  • 开发者和企业:
     已开始在 Gemini API、Google AI Studio 和 Google Antigravity 中推出。企业用户今日起可在 Vertex AI 中开始构建,并将很快登陆 Gemini Enterprise。
  • 创意工作者:
     已开始向 Flow(AI 电影制作工具)中的 Google AI Ultra 订阅者推出。

关于 AI 生成图像的识别

所有由 Google 工具生成的媒体都嵌入了不易察觉的 SynthID 数字水印。现在,用户可以直接在 Gemini 应用中上传图片,并询问它是否由 Google AI 生成。该功能目前支持图片,并将很快扩展到音频和视频。

此外,免费和 Google AI Pro 等级用户生成的图片上会保留可见的 Gemini 星形水印。为满足专业工作的视觉纯净需求,Google AI Ultra 订阅者以及在 Google AI Studio 中生成的图片将去除此可见水印。


7个使用技巧助你玩转 Nano Banana Pro

为了获得最佳效果和更精细的创意控制,以下是一些编写专业提示词的技巧:

  1. 生成带有清晰文本的视觉效果:
     利用其卓越的文本渲染能力创作海报、图表等。
  2. 利用真实世界知识进行创作:
     借助 Gemini 3 Pro 的知识和推理能力,获得精确、丰富的图像结果。
  3. 翻译和本地化你的想法:
     在图像内部生成或翻译文本,以适应不同市场。
  4. 使用工作室级别的控制进行编辑:
     直接控制光照、相机角度、焦点、色彩等参数。
  5. 精确调整尺寸:
     尝试不同的宽高比,并生成高达 4K 的清晰图像。
  6. 融合图像并保持多角色一致性:
     将多达 14 个输入融合,并保持多个角色的一致性。
  7. 创建并保持品牌视觉风格:
     将图案、标志等无缝应用到 3D 对象上,保持自然的质感。

Change the look and feel of an image for a range of platforms by adapting the aspect ratio.


当前的局限性

目前仍有一些领域需要改进:

  • 视觉和文本保真度:
     渲染小文本、精细细节和精确拼写可能不完美。
  • 数据和事实准确性:
     请务必核实如图表等数据驱动型视觉内容的事实准确性。
  • 翻译和本地化:
     多语言文本生成可能存在语法错误或文化细微差异。
  • 复杂编辑和图像融合:
     高级编辑任务有时可能产生不自然的伪影。
  • 角色特征:
     角色一致性虽通常可靠,但跨编辑时可能会有变化。

【声明】内容源于网络
0
0
赛博禅心
拜AI古佛,修赛博禅心
内容 465
粉丝 0
赛博禅心 拜AI古佛,修赛博禅心
总阅读981
粉丝0
内容465