大数跨境
0
0

性能秒杀SD3、MJ,前Stability AI核心成员开源12B图像生成模型​FLUX.1

性能秒杀SD3、MJ,前Stability AI核心成员开源12B图像生成模型​FLUX.1 杭州文创数字科技研究院
2024-08-06
0
导读:前Stability AI首席科学家最新开源模型。
FLUX.1 是由前 Stability AI 核心成员 Robin Rombach 创立的新公司 Black Forest Labs 开源的 AI 图像生成模型,它在图像生成领域引起了广泛关注。Robin Rombach 是扩散模型领域的权威专家,曾领导开发了著名的 Stable Diffusion 模型

1.模型介绍

在手部生成方面,FLUX.1的pro版本和dev版本都展现出了较高的成功率和精细的细节处理能力,而schnell版本虽然在这两方面稍逊一筹,但整体表现仍然相当不错。在属性匹配、光影效果、细节处理以及自然度上,pro版本的表现尤为出色,文本内容的变化也能很好地反映在生成的图像中。dev版本已经非常接近pro版本,因此它是一个实用的选择,这也是它采用非商业许可证的原因之一。相比之下,schnell的4步模型与前两者存在明显差距。

在理解并跟随提示词方面,所有版本都表现出色,差异不大。FLUX.1系列在图像生成方面确实具有一些显著的优势,特别是对于社区来说,dev版本是一个非常好的选择。

以下是FLUX.1系列不同版本的演示链接,供参考:

schnell demo:https://huggingface.co/spaces/black-forest-labs/FLUX.1-schnell

dev demo:https://replicate.com/black-forest-labs/flux-dev

pro demo:https://replicate.com/black-forest-labs/flux-pro

开源地址:https://github.com/black-forest-labs/flux

由于模型的体积达到了23.8G,这使得它难以在24G显存的4090显卡上顺利运行,或许将来的28G显存的5090显卡会是一个可行的选择?

FLUX.1的架构以Vision Transformer为基础,通过流程匹配训练和先进的技术如旋转位置嵌入与并行注意层,优化了性能和硬件效率。

这款拥有120亿参数的模型,推出了三个版本:Pro版适用于API调用,dev版作为非商业用途的模型,继承了Pro版的多数优势;schnell版则是一个商用的开源模型。

所有 FLUX.1型号都支持 0.1和 2.0 百万像素的各种纵横比和分辨率,如以下示例所示

FLUX.1的三个版本在文本理解、图像质量、动作流畅性以及创作多样性上均超越了Midjourney v6.0、DALL·E 3和SD3-Ultra等竞争对手,整体表现卓越。同时,在将文本内容转化为图像的能力上,FLUX.1也展现了更佳的效果。

2.效果测评

一张旧教室里黑板的照片。黑板上用粉笔写着“让我们一起做一些非常漂亮的东西”,词后有一个红色的粉笔心,阳光从窗户照进来。

水下场景中,两只猫头鹰坐在一张精美的餐桌旁,餐桌中央点燃了蜡烛,两只猫头鹰正在一起享用一顿美味的晚餐。左边的猫头鹰穿着燕尾服,右边的猫头鹰穿着漂亮的裙子。

背景中有一艘潜艇驶过,其侧面画着“What a Hoot”字样。桌子下面的图像底部有小水母在游动,电影般美丽的数字艺术品。

两只穿着维多利亚服装的可爱蜘蛛正在举办一个微型茶会,叶子上有一张小桌子和茶壶。

一位女足球运动员,穿着一件阿迪达斯的球衣,周围是其他运动员模糊效果。

一位三十多岁出头的女子在八角形木制舞池中央弹奏手风琴,舞池有一个木制屋顶,周围是成对跳舞的舞者。

黑森林蛋糕拼出“24”字样,美味,美食摄影,动态拍摄



    版权声明:【除原创作品外,本平台所使用的文章、图片、视频及音乐属于原权利人所有,因客观原因或会存在不当使用的情况,如,部分文章或文章部分引用内容未能及时与原作者取得联系,或作者名称及原始出处标注错误等情况,非恶意侵犯原权利人相关权益,敬请相关权利人谅解并与我们联系。

END




【声明】内容源于网络
0
0
杭州文创数字科技研究院
杭州文创数字科技研究院以“数字科技+文化创意”深度融合为核心,依托人工智能生成内容、数字孪生、区块链、元宇宙等前沿技术,构建“技术研发—场景应用—产业赋能—国际协作”全链路生态,打造长三角地区数字文创领域的技术创新引擎与产业孵化标杆。
内容 473
粉丝 0
杭州文创数字科技研究院 杭州文创数字科技研究院以“数字科技+文化创意”深度融合为核心,依托人工智能生成内容、数字孪生、区块链、元宇宙等前沿技术,构建“技术研发—场景应用—产业赋能—国际协作”全链路生态,打造长三角地区数字文创领域的技术创新引擎与产业孵化标杆。
总阅读555
粉丝0
内容473