大数跨境
0
0

OpenAI放大招!看GPT-4o飞跃提升的原生生图能力

OpenAI放大招!看GPT-4o飞跃提升的原生生图能力 杭州文创数字科技研究院
2025-03-29
0
导读:“FEEL THE AGI”3月26日,OpenAI在发布会现场,通过GPT-4o将一张三人自拍照转换为动漫

“FEEL THE AGI”

3月26日,OpenAI在发布会现场,通过GPT-4o将一张三人自拍照转换为动漫风格,并添加了文字“FEEL THE AGI”


OpenAI 官方带头整活

至此生成了一张网络名梗表情包🤖


所谓AGI,它的英文全称为Artificial General Intelligence,也就是人工通用智能“感受到AGI的存在”,幽默诙谐地暗示了本次模型能力的飞跃提升。


根据Open AI官网发布的介绍指南中,我们整理了其中部分重点和您分享:


使用方式及特性


👉简易操作的逻辑和使用流程

用户只需像日常对话一样向GPT-4o描述需求即可生成图像。

此外,可以支持定制一些高级参数:

✅支持画幅比例定制(如16:9、1:1)

✅精确色彩控制(使用十六进制颜色代码指定)

✅透明背景生成(适用于设计素材导出)


👉相对延长的渲染时间及更精密的图像

由于模型生成的图像细节复杂度显著提升(如物理精确的光影效果、高分辨率纹理),单张图片渲染时间通常需要约1分钟,较前代产品有所延长。


能力提升


👉图像与语言基础上的多模态联合训练突破
GPT-4o通过对在线图像与文本的联合分布进行模型训练,使系统不仅理解图像与语言的关联性,更掌握了图像之间的内在联系。配合密集的后训练优化,最终使模型展现出惊人的视觉表达能力,生成兼具实用性、连贯性和场景感知力的图像。

创建两个20多岁的女巫阅读路标的照片级真实感图像

对背景、角色和构图进一步要求


多轮生成

由于图像生成功能现已原生支持于 GPT-4o,使用者可以通过自然对话对图像进行优化。GPT-4o 能够基于聊天上下文中的图像和文本进行构建,确保整个过程中的一致性。

一只小浣熊的设计,尝试不同的设计风格

例如,在设计视频游戏角色时,随着您不断优化和尝试新方案,角色的外观会在多次迭代中始终保持连贯性。


上下文结合学习

GPT‑4o能够分析并学习用户上传的图像,将其具体细节无缝融入自身的上下文环境中,从而指导图像生成过程。

用生成的电锯制作一段广告

广告内容为奶奶在感恩节餐桌上切火鸡并要求添加标语


节选:Introducing 4o Image Generation | OpenAI

OpenAI也在产品指南的最后,谦虚地表达他们的模型并不完美,且目前意识到存在多个限制,他们将在首次发布后通过模型改进来努力解决这些限制。


全面的技术优势就是生产力。这也证明OpenAI目前的技术道路还是正确的。探索未来AI发展的更多道路,我们将拭目以待。


看网友锐评GPT-4o


AI不替代设计,而是延伸创造力



我们的同事初次尝试CPT-4o的出图成果

效果是不是也非常炫酷😎


最近工业设计圈讨论AI辅助工具的效率愈来愈火热~


当全球惊叹于GPT-4o的多模态对话变革时,我们设计魔方更关注您如何掌握这项技术的底层逻辑和实际应用


我们的课程从智能草图迭代到参数化建模都有实战演示,用AI快速搞定工业设计中的概念发散和效果图渲染。


【让AI不再停留于单次惊艳】

而是成为工业设计从业者

👇可持续迭代的创作伙伴👇

扫码右下方二维码立即咨询💬


了解更多GPT-4o相关知识

欢迎加入设计魔方交流群学习交流

观看实战案例+领取资料📚


用GPT-4o级别的系统思维

重新定义AIGC生产力!


  往期回顾  



  推荐关注  

【声明】内容源于网络
0
0
杭州文创数字科技研究院
杭州文创数字科技研究院以“数字科技+文化创意”深度融合为核心,依托人工智能生成内容、数字孪生、区块链、元宇宙等前沿技术,构建“技术研发—场景应用—产业赋能—国际协作”全链路生态,打造长三角地区数字文创领域的技术创新引擎与产业孵化标杆。
内容 473
粉丝 0
杭州文创数字科技研究院 杭州文创数字科技研究院以“数字科技+文化创意”深度融合为核心,依托人工智能生成内容、数字孪生、区块链、元宇宙等前沿技术,构建“技术研发—场景应用—产业赋能—国际协作”全链路生态,打造长三角地区数字文创领域的技术创新引擎与产业孵化标杆。
总阅读730
粉丝0
内容473