1.模型介绍
在手部生成方面,FLUX.1的pro版本和dev版本都展现出了较高的成功率和精细的细节处理能力,而schnell版本虽然在这两方面稍逊一筹,但整体表现仍然相当不错。在属性匹配、光影效果、细节处理以及自然度上,pro版本的表现尤为出色,文本内容的变化也能很好地反映在生成的图像中。dev版本已经非常接近pro版本,因此它是一个实用的选择,这也是它采用非商业许可证的原因之一。相比之下,schnell的4步模型与前两者存在明显差距。
在理解并跟随提示词方面,所有版本都表现出色,差异不大。FLUX.1系列在图像生成方面确实具有一些显著的优势,特别是对于社区来说,dev版本是一个非常好的选择。
schnell demo:https://huggingface.co/spaces/black-forest-labs/FLUX.1-schnell
dev demo:https://replicate.com/black-forest-labs/flux-dev
pro demo:https://replicate.com/black-forest-labs/flux-pro
开源地址:https://github.com/black-forest-labs/flux

由于模型的体积达到了23.8G,这使得它难以在24G显存的4090显卡上顺利运行,或许将来的28G显存的5090显卡会是一个可行的选择?

FLUX.1的架构以Vision Transformer为基础,通过流程匹配训练和先进的技术如旋转位置嵌入与并行注意层,优化了性能和硬件效率。
这款拥有120亿参数的模型,推出了三个版本:Pro版适用于API调用,dev版作为非商业用途的模型,继承了Pro版的多数优势;schnell版则是一个商用的开源模型。
所有 FLUX.1型号都支持 0.1和 2.0 百万像素的各种纵横比和分辨率,如以下示例所示

FLUX.1的三个版本在文本理解、图像质量、动作流畅性以及创作多样性上均超越了Midjourney v6.0、DALL·E 3和SD3-Ultra等竞争对手,整体表现卓越。同时,在将文本内容转化为图像的能力上,FLUX.1也展现了更佳的效果。

2.效果测评
一张旧教室里黑板的照片。黑板上用粉笔写着“让我们一起做一些非常漂亮的东西”,词后有一个红色的粉笔心,阳光从窗户照进来。

水下场景中,两只猫头鹰坐在一张精美的餐桌旁,餐桌中央点燃了蜡烛,两只猫头鹰正在一起享用一顿美味的晚餐。左边的猫头鹰穿着燕尾服,右边的猫头鹰穿着漂亮的裙子。
背景中有一艘潜艇驶过,其侧面画着“What a Hoot”字样。桌子下面的图像底部有小水母在游动,电影般美丽的数字艺术品。

两只穿着维多利亚服装的可爱蜘蛛正在举办一个微型茶会,叶子上有一张小桌子和茶壶。

一位女足球运动员,穿着一件阿迪达斯的球衣,周围是其他运动员模糊效果。

一位三十多岁出头的女子在八角形木制舞池中央弹奏手风琴,舞池有一个木制屋顶,周围是成对跳舞的舞者。

黑森林蛋糕拼出“24”字样,美味,美食摄影,动态拍摄

版权声明:【除原创作品外,本平台所使用的文章、图片、视频及音乐属于原权利人所有,因客观原因或会存在不当使用的情况,如,部分文章或文章部分引用内容未能及时与原作者取得联系,或作者名称及原始出处标注错误等情况,非恶意侵犯原权利人相关权益,敬请相关权利人谅解并与我们联系。
END






