大数跨境
0
0

黑森林开源Flux.1 Kontext Dev 模型

黑森林开源Flux.1 Kontext Dev 模型 AI算法之道
2025-07-02
0
导读:Flux.1 Kontext Dev 模型开源
点击蓝字
关注我们










01


引言


黑森林实验室(BFL)终于发布了Flux.1 Kontext Dev——这是Flux.1 Kontex Pro的开源权重模型及开发者版本。

官网博客:https://bfl.ai/announcements/flux-1-kontext-dev

这对AI领域意义重大,因为当前最新最强的图像模型(如谷歌的Imagen 4、OpenAI的GPT-Image-1和Midjourney V7)均为闭源。开放权重的模型对技术创新至关重要。

那么Flux Kontext Dev与Pro版、Max版有何不同?如何获取?效果测试?本文将逐一解答这些问题。

我们开始吧。




02

  什么是Flux.1 Kontext Dev ?

关于这个模型,最关键的亮点在于它是开源权重的。这意味着训练完成的模型参数(即"权重")可供任何人下载使用。

在AI领域,"权重"是模型在训练过程中学习到的数值,决定了模型内部各组件之间的关系,并影响其处理信息的方式。

Flux Kontext Dev的权重现已登陆HuggingFace平台开放下载。

地址:https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev

不过需要注意:其safetensor文件体积接近24GB,本地运行需确保磁盘空间充足。没错,这个120亿参数的模型能提供专业级的编辑性能,却依然支持消费级硬件运行。

具体部署方法可参考GitHub代码库中的说明。

Github:https://github.com/black-forest-labs/flux

注:该仓库包含最简推理代码,支持基于BFL Flux开源权重模型进行图像生成与编辑。

Flux Kontext的核心功能包括:

  • 风格迁移:将照片转为水彩、油画、素描等艺术风格

  • 物体/服饰修改:调整发型、添加配饰、更改颜色

  • 文字编辑:替换标牌/海报中的文字内容

  • 背景替换:在保留主体的前提下切换场景

  • 角色一致性:确保多次编辑后人物特征不漂移

Flux.1 Kontext Dev专精于编辑任务,支持迭代式修改,擅长跨场景的角色特征保持,既能进行局部精细调整,也可实现全局编辑。

技术细节可查阅下方论文。

arxiv: https://arxiv.org/abs/2506.15742





03

  性能表现

Flux Kontext Dev 的性能已可媲美 Gemini 2.0 Flash 和字节跳动 Bagel 等顶级商业模型,仅次于 GPT-4o 和 BFL 自家的私有模型栈。最新评测结果可在此处查阅。

Leadboard榜单:

https://artificialanalysis.ai/text-to-image/arena?tab=leaderboard&input=image

这些结果也获得了第三方机构 Artificial Analysis 的独立验证确认。

根据最新发布的图像编辑基准测试 KontextBench 的人类偏好评估显示,Flux.1 Kontext Dev 的表现优于字节跳动 Bagel、HiDream-E1-Full 等其他开源模型,甚至超越了谷歌 Gemini-Flash Image 等闭源方案。

BFL 与英伟达展开深度合作,专门针对新一代 Blackwell 架构开发了 TensorRT 优化权重。在保持高质量图像编辑性能的同时,大幅提升了推理速度并降低了显存占用。

这些经过优化的权重确保 Flux.1 Kontext Dev 能够充分发挥最新硬件的性能潜力。





04

  如何访问?

访问此模型有多种方式。

  • 对于开发者:最佳方式是通过Fal AI或Replicate生成图像

  • 对于企业:可以直接从Black Forest Labs购买许可证

  • 对于普通用户:在Flux Labs AI上进行图像编辑或生成

在网页应用中推荐大家使用的唯一两个API平台是Fal AI和Replicate,因为它们可靠且易于使用。

要开始使用Fal,可以访问fal.ai并创建账户。你需要购买积分充值,以便开始使用API端点。在搜索栏中搜索“Flux Kontext Dev”,你应该会看到以下页面。

Fal官网: https://fal.ai/

然后在Playground标签中试用模型,观察像推理步骤数、CFG值和种子等参数是如何影响输出图像的。

以下是API调用的示例:

import { fal } from "@fal-ai/client";const result = await fal.subscribe("fal-ai/flux-kontext/dev", {  input: {    prompt"Change the setting to a day time, add a lot of people walking the sidewalk while maintaining the same style of the painting",    image_url"https://storage.googleapis.com/falserverless/example_inputs/kontext_example_input.webp"  },  logstrue,  onQueueUpdate(update) => {    if (update.status === "IN_PROGRESS") {      update.logs.map((log) => log.message).forEach(console.log);    }  },});console.log(result.data);console.log(result.requestId);

如果你偏好按使用付费的方式,可以使用Replicate。注册在replicate.com,绑定信用卡,然后开始使用API。你可以在这里找到Flux.1 Kontext Dev模型。

官网:https://replicate.com/black-forest-labs/flux-kontext-dev

与Fal AI相比,我发现Replicate提供了更多的选项,比如调整纵横比、输出质量,甚至在需要生成NSFW内容时关闭安全检测。

以下是Replicate上的API调用示例:

import { writeFile } from "fs/promises";import Replicate from "replicate";const replicate = new Replicate();const input = {    prompt"Change the car color to red, turn the headlights on",    input_image"https://replicate.delivery/pbxt/N5YURZv4ifaW2bMwU7hmrwzgtxf99DTQXpBeobLt1O7dEc3h/pexels-jmark-253096.jpg",    output_format"jpg"};const output = await replicate.run("black-forest-labs/flux-kontext-dev", { input });await writeFile("output.jpg", output);//=> output.jpg written to disk





05

  效果展示

现在进入最有趣的部分——让我们用Flux Kontext Dev来编辑一张图片。

首先需要准备一张参考图。我直接用Flux Labs AI快速生成了一张,使用的提示词如下:

Prompt:专业影棚近景人像,一位面容姣好的女性模特,柔和的漫射光突出面部轮廓,化着淡雅自然妆容,发型精致,中性渐变背景虚化,浅景深效果,高清肖像,电影质感镜头,视线微微偏离镜头,优雅从容的神态。

我将照片保存到我的本地磁盘,现在是时候用 Flux Kontext Dev 编辑它了。回到 Fal AI 并上传图像文件。 然后将提示词设置为: “让她戴上黑色帽子和黑色太阳镜。”

太棒了。 我喜欢此结果中原始主题的一致性。 尽管背景有一些细微的变化。 但总的来说,Flux Kontext Dev 目前是最好的图像编辑模型。

您基本上可以对图像进行任何您想要的更改。 它快速且非常容易。 不需要 Photoshop 高级编辑技能。





06

  总 结

非常高兴Flux.1 Kontext Dev终于发布了。作为一个一直密切关注Flux模型,并且自己也用它们开发应用的人,这次的更新对我来说意义重大对于常规的图像生成,我仍然喜欢使用Flux Kontext Max。但在编辑方面,Kontext Dev让人更加兴奋。大家可以在自己的机器上运行它,也可以基于开源权重训练LoRA。

总之,Flux 是我使用过的唯一一个能提供这种质量的开源模型。推荐大家积极进行尝试!






点击上方小卡片关注我




添加个人微信,进专属粉丝群!



【声明】内容源于网络
0
0
AI算法之道
一个专注于深度学习、计算机视觉和自动驾驶感知算法的公众号,涵盖视觉CV、神经网络、模式识别等方面,包括相应的硬件和软件配置,以及开源项目等。
内容 573
粉丝 0
AI算法之道 一个专注于深度学习、计算机视觉和自动驾驶感知算法的公众号,涵盖视觉CV、神经网络、模式识别等方面,包括相应的硬件和软件配置,以及开源项目等。
总阅读256
粉丝0
内容573