>

性能秒杀SD3、MJ，前Stability AI核心成员开源12B图像生成模型FLUX.1

>

0

0



性能秒杀SD3、MJ，前Stability AI核心成员开源12B图像生成模型FLUX.1

性能秒杀SD3、MJ，前Stability AI核心成员开源12B图像生成模型FLUX.1

杭州文创数字科技研究院

2024-08-06

0

导读：前Stability AI首席科学家最新开源模型。

FLUX.1 是由前 Stability AI 核心成员 Robin Rombach 创立的新公司 Black Forest Labs 开源的 AI 图像生成模型，它在图像生成领域引起了广泛关注。Robin Rombach 是扩散模型领域的权威专家，曾领导开发了著名的 Stable Diffusion 模型

1.模型介绍

在手部生成方面，FLUX.1的pro版本和dev版本都展现出了较高的成功率和精细的细节处理能力，而schnell版本虽然在这两方面稍逊一筹，但整体表现仍然相当不错。在属性匹配、光影效果、细节处理以及自然度上，pro版本的表现尤为出色，文本内容的变化也能很好地反映在生成的图像中。dev版本已经非常接近pro版本，因此它是一个实用的选择，这也是它采用非商业许可证的原因之一。相比之下，schnell的4步模型与前两者存在明显差距。

在理解并跟随提示词方面，所有版本都表现出色，差异不大。FLUX.1系列在图像生成方面确实具有一些显著的优势，特别是对于社区来说，dev版本是一个非常好的选择。

以下是FLUX.1系列不同版本的演示链接，供参考：

schnell demo：https://huggingface.co/spaces/black-forest-labs/FLUX.1-schnell

dev demo：https://replicate.com/black-forest-labs/flux-dev

pro demo：https://replicate.com/black-forest-labs/flux-pro

开源地址：https://github.com/black-forest-labs/flux

由于模型的体积达到了23.8G，这使得它难以在24G显存的4090显卡上顺利运行，或许将来的28G显存的5090显卡会是一个可行的选择？

FLUX.1的架构以Vision Transformer为基础，通过流程匹配训练和先进的技术如旋转位置嵌入与并行注意层，优化了性能和硬件效率。

这款拥有120亿参数的模型，推出了三个版本：Pro版适用于API调用，dev版作为非商业用途的模型，继承了Pro版的多数优势；schnell版则是一个商用的开源模型。

所有 FLUX.1型号都支持 0.1和 2.0 百万像素的各种纵横比和分辨率，如以下示例所示

FLUX.1的三个版本在文本理解、图像质量、动作流畅性以及创作多样性上均超越了Midjourney v6.0、DALL·E 3和SD3-Ultra等竞争对手，整体表现卓越。同时，在将文本内容转化为图像的能力上，FLUX.1也展现了更佳的效果。

2.效果测评

一张旧教室里黑板的照片。黑板上用粉笔写着“让我们一起做一些非常漂亮的东西”，词后有一个红色的粉笔心，阳光从窗户照进来。

水下场景中，两只猫头鹰坐在一张精美的餐桌旁，餐桌中央点燃了蜡烛，两只猫头鹰正在一起享用一顿美味的晚餐。左边的猫头鹰穿着燕尾服，右边的猫头鹰穿着漂亮的裙子。

背景中有一艘潜艇驶过，其侧面画着“What a Hoot”字样。桌子下面的图像底部有小水母在游动，电影般美丽的数字艺术品。

两只穿着维多利亚服装的可爱蜘蛛正在举办一个微型茶会，叶子上有一张小桌子和茶壶。

一位女足球运动员，穿着一件阿迪达斯的球衣，周围是其他运动员模糊效果。

一位三十多岁出头的女子在八角形木制舞池中央弹奏手风琴，舞池有一个木制屋顶，周围是成对跳舞的舞者。

黑森林蛋糕拼出“24”字样，美味，美食摄影，动态拍摄

版权声明:【除原创作品外，本平台所使用的文章、图片、视频及音乐属于原权利人所有，因客观原因或会存在不当使用的情况，如，部分文章或文章部分引用内容未能及时与原作者取得联系，或作者名称及原始出处标注错误等情况，非恶意侵犯原权利人相关权益，敬请相关权利人谅解并与我们联系。

END

【声明】内容源于网络

0

0

杭州文创数字科技研究院

杭州文创数字科技研究院以“数字科技+文化创意”深度融合为核心，依托人工智能生成内容、数字孪生、区块链、元宇宙等前沿技术，构建“技术研发—场景应用—产业赋能—国际协作”全链路生态，打造长三角地区数字文创领域的技术创新引擎与产业孵化标杆。

内容 473

粉丝 0

杭州文创数字科技研究院杭州文创数字科技研究院以“数字科技+文化创意”深度融合为核心，依托人工智能生成内容、数字孪生、区块链、元宇宙等前沿技术，构建“技术研发—场景应用—产业赋能—国际协作”全链路生态，打造长三角地区数字文创领域的技术创新引擎与产业孵化标杆。

总阅读555

粉丝0

内容473