大数跨境

Nano Banana:AI 绘图一致性新标杆,LMArena 盲测表现惊艳,完胜多模型,疑似谷歌新作,生图精准度成行业焦点

Nano Banana:AI 绘图一致性新标杆,LMArena 盲测表现惊艳,完胜多模型,疑似谷歌新作,生图精准度成行业焦点 元龙数字智能科技
2025-08-19
2

Nano Banana

AI绘图一致性新标杆

LMArena 盲测表现惊艳

完胜多模型,疑似谷歌新作

生图精准度成行业焦点


“史诗级” 这类词汇在当下常被过度使用,但对于 Nano Banana 这款全新的 AI 绘图模型而言,经过数日的实际操作检验,其性能确实担得起这样的定位。该模型最显著的技术优势在于图像生成的一致性,其水准已达到相当高的程度,这在实际工作场景中展现出了切实价值 —— 以视频封面制作为例,此前借助其他模型时始终难以实现理想效果,直到 Nano Banana 出现后,这一问题才得到解决。

借助具体案例可直观呈现其优势。左侧为测试者的个人照片,右侧则是利用 Nano Banana 生成的最新一期视频封面底图。操作过程中,测试者将个人照片作为参考图输入,并附上如下提示文本:“A man with the same facial features and appearance as the person in the reference image is facing the camera. One hand is making a gesture that forms the number "0," while the other hand is holding three colorful children's picture books. His expression is natural and engaged, with a lively and playful pose. The scene conveys a lighthearted and humorous atmosphere. The background is a simple indoor setting with soft natural lighting. Realistic photographic style, 4K resolution, high detail, shallow depth of field.” 观察可知,Nano Banana 几乎完整保留了测试者的面部特征与表情,即便嘴角的弧度也与原图高度契合,仅按照提示文本调整了动作与手势,在人物形象一致性的呈现上表现堪称卓越。

对比其他模型的生成结果,差异呈现得尤为清晰。将各模型的成果拼接后进行直观比对:最左侧是 GPT-4o 的输出内容,尽管在数月前刚推出时表现尚佳,但从当前结果来看,其人物一致性表现欠佳,且画面存在明显的泛黄滤镜效果,视觉呈现偏陈旧,与 Nano Banana 的结果相比差距显著;中间是 Flux Kontext 生成的内容,其塑造的形象与测试者特征差异较大,且在未收到相关指令的情况下,擅自将表情调整为憨笑,与需求不匹配;最右侧是即梦模型的输出,该模型虽在衣服图标等细节保留上表现尚可,但人物面部特征与原图偏差较大,手部绘本的呈现也存在明显不合理之处。综合来看,Nano Banana 在此次对比中优势突出,处于领先位置。

在封面制作等场景中,保持人物形象的一致性是核心需求之一,而当前多数 AI 模型因一致性水平有限,难以满足这一基础要求。与之不同的是,使用 Nano Banana 时,通常生成 1-2 次即可得到满意结果,效率与效果均较为理想。不过,该模型目前仍带有较强的神秘感,仅在 LMArena 平台出现。对于熟悉大模型评测领域的从业者而言,LMArena 是当前全球主流的大模型竞技平台,其核心评测逻辑是让两个模型进行匿名对抗,用户依据生成成果进行选择投票,平台再通过系列算法得出模型排名。许多厂商在新模型正式发布前,常会以特殊代号将其置于 LMArena 平台进行用户盲测,以收集实际应用反馈,Nano Banana 大概率就属于这类提前测试的神秘模型 —— 目前无公开使用链接,仅在 LMArena 的生图评测中随机出现,神秘感十足。

在此之前,生图领域处于 seedream、flux、gpt、google imagen 等多模型竞争的局面。然而,在某次测评过程中,用户发现一款名为 “Banana” 的未知模型突然出现,该模型未被列入已有的生图模型列表,仅在随机测评中偶尔现身,因此被不少人认为 “神秘感较强”。在后续测试中,用户进一步发现这款 “Banana” 模型性能表现尤为亮眼,尤其在人物一致性方面性能优异,几乎达到行业领先水平。由此,Nano Banana 在海外网络迅速受到关注,用户间相互传播,许多人在 LMArena 平台反复尝试生成图像,希望借助该模型完成各类创作 —— 例如将二维角色转化为 3D 手办、为手办添加个性化背景,甚至实现不同角色的创意联动,且生成的人物形象与原形象均保持高度一致。

随着 Nano Banana 的热度攀升,其归属问题引发关注。经相关推测与验证,该模型疑似隶属于谷歌。尽管 Google 尚未对此进行官方确认,但有测试者通过特定测试引导,使 Nano Banana 在生成图像中呈现出 Google DeepMind 的标识。结合这一现象及模型的出现场景,业内推测 Nano Banana 可能是谷歌即将推出的新模型,此次在 LMArena 平台的出现是为了低调测试其实际性能,这也解释了为何该模型仅在对战中随机出现,且具有较强的神秘感。

关于该模型的使用流程,设置得较为简洁:先登录 LMArena 平台官网(https://lmarena.ai/),在顶部功能区选择 “battle” 模式,无需进行额外参数配置,直接输入提示文本与参考图像即可。系统会随机选取两个模型生成对应图像,且不会告知用户模型名称,需用户先对生成效果进行选择,之后才会揭晓模型信息。不过,用户选中的模型未必是 Nano Banana,由于盲测机制的存在,其出现具有随机性,但一旦出现,生成效果往往较为突出。这种不确定性给用户带来了一定困扰,有时连续测试 4-5 次也无法遇到 Nano Banana,且过程中常需进行人机验证,还频繁出现报错情况。据测试者反馈,若不是其效果优异,测试过程中的诸多阻碍足以让测试中断,因此不少用户期待 Google 能尽快将其接入 AI Studio 或 Gemini 平台。

为全面呈现 Nano Banana 的实际性能,测试者耗费一日时间,将 Nano Banana 与 flux、gpt4o、即梦等模型进行对比测试,测试结果拼接后具有较强的直观性。在单个主体一致性测试中,测试者向各模型提供一张原图,并搭配提示词,要求图中女性直面镜头、伸手触碰镜头以营造 “打破第四面墙” 的效果。结果显示,左上 Nano Banana 生成的内容表现最优,不仅完整保留了主体的妆容、服饰与头饰等特征,且严格按照提示词完成动作;flux 与 seedream 生成的主体特征虽大致合理,但动作呈现较为生硬;gpt 的表现最差,不仅主体特征保留不足,还延续了其标志性的泛黄滤镜,差距十分明显,此轮测试 Nano Banana 轻松胜出。

多主体测试中,测试者以经典电影海报《罗马假日》为基础,提示词要求将男女主替换为川普与马斯克,并将电影名改为 “doge holiday”。结果依旧是左上 Nano Banana 的表现最为成功,生成形象与川普、马斯克的特征贴合度较高;gpt4o 仍存在画面泛黄问题,且对马斯克形象的还原度不足;Flux 的表现更为逊色,生成了两个与马斯克特征偏差较大的相似形象;seedream 因无法生成川普形象,仅以一名金发老人替代,且遗漏了马斯克的形象生成,此轮测试 Nano Banana 再次获胜。

背景替换能力测试中,测试者使用一张漫展拍摄的机甲图,提示词要求 “Replace the background with a cinematic post-apocalyptic ruin. The scene should feature destroyed buildings, rubble, and a dark, dramatic atmosphere. Behind the character, a massive explosion with fiery glow and billowing black smoke rises, creating intense tension and a sense of chaos. The overall look should be highly detailed, with realistic textures, strong contrast, and a cinematic color grade. Photorealistic style, 4K resolution, high detail.” 按此前顺序,左上 Nano Banana 的背景生成效果最佳,爆炸场景中主体受强光照射的光影效果真实自然,画面对比强烈,背景中废墟大楼的细节也十分丰富;flux 与 gpt 生成的背景较为模糊,细节处理草率;seedream 的背景处理同样简略,且无端增加了一个蹲姿人物形象,此轮测试 Nano Banana 再获胜利。

主体一致性与背景替换结合测试中,提示词的核心要求是将手办放入盒子中。初看之下仅有 gpt 的结果需直接排除,但经仔细观察发现,flux 对该手办的眉眼与表情进行了未授权修改,导致原本风格元气的手办呈现出无精神的状态;seedream 此次表现较好,与 Nano Banana 基本持平。

动作迁移能力测试中,因缺乏适配图像,测试者使用 “鸡你太美” 表情包与一张长期使用的个人照片作为素材,且因即梦不支持多图参考,仅 Nano Banana、gpt、flux 参与测试。从左至右观察可见,Nano Banana 依旧表现最强,对主体与动作的还原均较为理想;gpt 的结果仍不符合预期,表现欠佳。

人物情绪测试中,测试者以一对 “酷哥酷姐” 形象为基础,设置了高兴、生气、一方嘲笑另一方等场景 —— 无论是两人欢笑、发怒的表情,还是男生 “食用怪味豆” 时女生嘲笑的场景,Nano Banana 均表现出色,即便在大表情状态下,人物形象也未出现崩坏,其在人物一致性与动作指令遵循方面的性能令人印象深刻。

细节修改能力测试使用报纸底图,提示词要求将中间的 “skor” 四个字母改为 “kazi”,结果显示仅有 Nano Banana 完全遵循指令,仅对指定字母进行修改,未对其他内容造成增减,精准度表现优异。

风格转换测试中,基于同一原图,分别进行了赛博朋克风格、梵高风格与水墨画风格的转换。赛博朋克风格转换中,Nano Banana 的完成度最高,画面精细度与人物一致性均领先其他模型;梵高风格转换中,其笔触呈现更为细腻,人物特征保留更佳;水墨画风格转换的结果同样如此,Nano Banana 的表现持续强势。

综合所有测评结果来看,Nano Banana 在生图效果上实现了完胜。seedream 与 flux 单次生成效果虽不及 Nano Banana,但整体质量尚可,只是需要多次尝试才能获取理想结果;gpt4o 的表现则难以获得正面评价。结合上述测评,利用一张照片与 Nano Banana 制作多动作真人视频封面的方法已清晰可见:只需准备用于封面的个人照片,搭配包含表情、动作、背景要求的提示词,在 LMArena 平台开启 battle 模式生成图像即可。生成后可根据直观感受选择效果更优的图像,多数情况下,效果最理想的图像大概率由 Nano Banana 生成,下载后即可使用,尚未尝试的用户可进行实践体验。

不得不承认,Google 在技术领域的布局确实全面,当前呈现出多领域突破、全面领先的态势,深厚的技术底蕴令人赞叹。就目前而言,Nano Banana 作为 “一致性之王” 当之无愧,只是未来这一领先地位将由谁接替,仍有待观察。




【声明】内容源于网络
0
0
元龙数字智能科技
永做第一 使命第一 向善第一
内容 901
粉丝 0
元龙数字智能科技 永做第一 使命第一 向善第一
总阅读730
粉丝0
内容901