引言
GPT Image-2 已经悄然上线了。
没有任何铺垫,也没有预告,OpenAI 直接在部分账号里灰度测试了这个代号叫 duct-tape-2 的新模型。起初是大家发现自己的 ChatGPT 突然能画出像素级精准的中文字,连直播间截图都能随手搓出来且毫无破绽。
还看到有其他直播间的生图。
如果你发现自己的 ChatGPT 生图也是如此,不用怀疑,你就是被选中的那一批。
看着GPT image 2这恐怖的生图质量,接下来恐怕谷歌该拉响红色警报了。
思考.
仔细思索了下最近常用的那几个生图软件。
不管是国外的小香蕉(Nano Banana),还是国内的即梦、可灵、海螺、通义千问,大家这半年全在卷同一件事:拼画质。你搞电影级光影,我搞毛孔级皮肤。
画风确实惊艳,可一旦给它们派点踏实的活儿——比如排版一张带活动时间的招聘海报,或者画个严谨的科研流程图,它们立马原形毕露。出来的图,要么排版错位得离谱,要么字迹糊成一团,再不然直接给你整出一堆看不懂的火星文。
搞艺术全是一把好手,但真要融进工作流里就很折腾。这也是为什么大伙儿用这些先进软件,极少能做到“一句话直出成品”。多数时候,你还是得拿着生成的半成品去反复抽卡,最后还得自己打开 PS 痛苦地改乱码、扣字、重新对版式,把时间全耗在了后期调试上。
GPT Image 2 这次能让全网疯狂刷新等测试资格,根本原因在于它换了赛道。网上的评价出奇一致:它真正理解了现实世界的排版规则,把精准生成中文和图表逻辑的陈年短板彻底补齐了。
它真的能直接拿来当干活的工具用吗?我们挑了几个地狱级难度的日常需求,去测一下它到底干的好不好。
AI+
场景一:极其惨烈的对比测试
这次我用了一个灰度账号(已覆盖GPT-Image-2)和一个普通账号(生图依然调用GPT-Image-1.5)做了测试,让它们同时在 ChatGPT 里各跑了一遍。结果极其惨烈。常规账号跑出来的图,字依然是扭曲的,排版全靠抽卡。
灰度测试账号制作出来的,是一张可以直接丢进工作群发给运营的海报。主标题、副标题、活动时间,字号大小错落有致,最离谱的是,上面的中文字没有一个错漏。它真的懂什么是版式设计。
场景二:把 IP 联动与复杂场景玩明白了
换个高难度的。过去让 AI 画两个不同画风的游戏角色同框,之前的模型基本上会糊成一团,或者互相传染画风。
这次直接让它画一张两种不同画风游戏角色的联动海报。秒出。谁是谁分得清清楚楚。不仅如此,包括直播间极其复杂的点赞按钮 UI、信封上的手写体寄件人信息,全部还原到了像素级。过去 AI 最头疼的细节识别,现在全过了。
场景三:审美在线的美工杀手
如果说前面只是能看,那接下来的产出就是真好看。
我们连着测试了国风日历、招聘海报、二次元角色日历,还有一份极其精致的书签。跑出来的每一张图,配色和留白都恰到好处,完全符合商用设计的美感。初级设计师这次可能真的要有失业风险了。
还有企业招聘海报的尝试。
虽然它还没有强大到搜索出前哨科技的logo,但它生成的这张海报,已经是直接可用的级别。
场景四:极其护肝的透明底生成
这是一个做 PPT 和做设计的人看了会流泪的功能。
它可以直接生成带透明底(Alpha通道)的小图标。这意味着你生成完直接拖进画布就能用,再也不用去 PS 里疯狂点魔棒抠图,或者找各种第三方去背景工具了。
场景五:让人后背发凉的造假能力
这是整个实测中最让我们沉默的一个环节。
我们尝试让它生成一张身份证件,以及一张微信聊天对话框的截图。
成品出来后,无论是微信字体的粗细、绿色的色值,还是证件底纹的质感,肉眼根本分不清真假。
大家以后在网上冲浪,看到所谓的截图证据,真的要多留个心眼。
吐槽与祛魅.
吹完了它的强悍,按规矩,我们得把实测里踩到的坑也摆出来。这套模型还没成仙:
1.长文本排版依然会迷糊:虽然短文案全写对了,但当我们把一份几百字的公司文件塞给它去排版时,字虽然没写错,但版式全乱了。它会搞混段落间距,出现对齐混乱。处理超密集长文本,它还是个半吊子。
2.空间推理与镜面反射还是不够稳:这算是 AI 的陈年老病了。在这两天网友的公开实测里,镜子里的文字方向是反的、水面反射的颜色对不上、复杂的专业解剖细节依然不准。在微观的物理引擎上,它还是会偶尔穿模。
3.太真实带来的反噬:这不是技术毛病,而是安全黑洞。就像前面测试的聊天记录和证件,当高度逼真的伪造门槛降到只需要敲一句话时,它带来的麻烦绝对比便利多。
三句话.
关于这次悄悄露面的 GPT Image 2,最后用三句话做个定调:
1.整个 AI 生图市场的游戏规则彻底变了,大家不能再躲在艺术感的遮羞布后面卷画质,接下来的生死线,是谁能真正跨进商业交付和打工人的实操环节。
2.在日常使用上,它干掉的其实是传统工作流里的中间步骤,PS排版、抠透明底、对齐字体这些脏活累活全被抹平,以后谁能把需求定义得最清楚,谁就能直接拿走成品。
3.当伪造一张连字体粗细、界面UI都像素级逼真的“聊天截图证据”只需要敲一句话时,互联网的信任底座其实已经被击穿了,保持怀疑将是以后冲浪的第一生存法则。
彩蛋.
这几天实测下来,我们跑废了无数次,终于摸索出了一套能最大化榨干 GPT Image 2 潜力的生图提示词架构文件。
不管你是想做 UI、画海报还是搞科研图,套用这个架构,出图成功率能翻倍。
老规矩,在后台回复【排版】,这套《标准版文生图提示词手册》直接拿走。

