大数跨境

OpenAI突然宣布:GPT-Image-2发布!这次,AI真的"会思考"了

OpenAI突然宣布:GPT-Image-2发布!这次,AI真的"会思考"了 cDesgin-天渊
2026-04-24
0
导读:全球首个具备"思考"能力的图像生成模型,Image Arena 1512分断层碾压第二名242分
我问你一个问题:你有没有想过,有一天AI生成图片的时候,它会先"想一想"——这个logo是什么颜色、这个场景需要什么光线、这个品牌该怎么呈现——然后才动手画?

这不,OpenAI还真就这么干了。

4月22日,OpenAI正式发布 ChatGPT Images 2.0,官方代号"Spud"(土豆)。但这次它不只是一款图像生成模型——它是全球首个具备"思考"能力的图像生成模型。

什么意思?以前的AI画图,你给个prompt,它就直接画。画出来品牌对不对、场景合不合理,它不管。ChatGPT Images 2.0不一样——它会先联网查资料,核实你提到的品牌、人物、场景信息,然后才生成。

1512分,断层碾压

到底有多强?来看权威榜单。

Image Arena是一个专门评测图像生成模型的竞技场,汇集了全球最顶尖的AI图像模型参赛。ChatGPT Images 2.0一出场,直接拿下 1512 分,登顶第一。

第二名是谁呢?谷歌的 Nano-banana-2,分数是 1270 分。

差了 242 分——这是什么概念?这是 Image Arena 历史上最大的一次分差,碾压级别。

这些场景才是真的牛

光看分数没感觉,来看看它实际能做什么。

官方演示了一个场景:输入一句话——"帮我生成一张科技产品的宣传海报,要有苹果的设计感,但要体现中国文化的元素"。ChatGPT Images 2.0会先思考:苹果的设计感是什么?极简、高端、白色主调。中国文化元素有哪些?水墨、红色、祥云。然后,它真的给你画出来了。

这意味着什么?以前你需要设计背景、配色、字体,分别让不同的工具生成,然后PS拼在一起。现在,一句话搞定。

还有几个细节,说出来你可能不信

一是文字渲染。AI生成图片最难的问题之一,就是图片里的文字正确率。以前模型生成一张带文字的海报,十有八九是乱码。这次 ChatGPT Images 2.0 把中文文字渲染准确率提高到了约 99%,接近商用级别。

二是生成速度。比上一代快了 2 倍,4096×4096 的分辨率,几十秒出图。

三是最狠的——全员免费开放。不只是付费用户,连免费用户都能用。这才是真正改变游戏规则的一步。

说实话,AI图像生成这个赛道,之前 Midjourney 和 Stable Diffusion 占了先机。但 OpenAI 这次入场,直接从"能用"跨越到了"好用"——而且是断层级的好用。那个 242 分的分差,不只是数字,是真实的技术代差。不过,话说回来,OpenAI 一向是"发布即巅峰,随后被追赶"。国产模型们,这次能跟上吗?

作者:cDesgin-天渊 | 发布日期:2026年4月24日

【声明】内容源于网络
0
0
cDesgin-天渊
AI前沿资讯,AI项目落地
内容 0
粉丝 0
cDesgin-天渊 AI前沿资讯,AI项目落地
总阅读0
粉丝0
内容0