大数跨境
0
0

阿里开源全模态融合智能体框架Pixelle MCP,任意comfyui工作流快速封装成MCP,可在大语言模型中直接调用!

阿里开源全模态融合智能体框架Pixelle MCP,任意comfyui工作流快速封装成MCP,可在大语言模型中直接调用! AIGC Studio
2025-08-15
2
导读:阿里开源的 Pixelle-MCP 实现了 ComfyUI 工作流向 LLM 可调用工具的自动转化,可以把任意comfyui工作流快速封装成MCP,支持文本、图像、语音、视频等全模态内容生成。

添加微信号:AIGC_Tech,公众号小助手会拉你进群!

GitHub - AIDC-AI/Pixelle-MCP: An Open-Source Multimodal AIGC Solution based  on ComfyUI + MCP + LLM https://pixelle.ai

阿里开源的 Pixelle-MCP 实现了 ComfyUI 工作流向 LLM 可调用工具的自动转化,可以把任意comfyui工作流快速封装成MCP,支持文本、图像、语音、视频等全模态内容生成,构建了一个“0代码开发多模态 Agent 工具链”的强大框架,兼容主流大模型与 Agent 框架(如 GPT、Llama、AutoGen),推动 AIGC 工具的标准化与模块化发展。显著降低了多模态智能体的开发门槛,为内容创作、智能客服、数字人等领域提供了高效、灵活的解决方案。

总结一句话就是:

                         Pixelle-MCP = ComfyUI + MCP + LLM

unsetunset功能特性unsetunset

  • ✅ 全模态支持: 支持TISV(Text、Image、Sound/Speech、Video)全模态的互转和生成
  • ✅ ComfyUI生态: Server端底层基于ComfyUI实现,继承ComfyUI的开放生态下的所有能力
  • ✅ 零代码开发: 制定并实现了 Workflow 即 MCP Tool 的方案,0代码开发,即可动态添加新的 MCP Tool
  • ✅ MCP Server: Server端基于MCP协议提供功能支持,支持任意mcp client集成(包含但不限于Cursor、Claude Desktop等)
  • ✅ MCP Client: Client端基于Chaintlit框架开发,继承了Chainlit的UI交互控件,支持集成更多的MCP Server
  • ✅ 灵活部署: 支持单独部署Server端仅提供MCP Server,或单独部署Client端仅提供MCP Client,或联合部署
  • ✅ 统一配置: 采用 YAML 配置方案,一个配置文件管理所有服务

unsetunset相关链接unsetunset

  • 源码:https://github.com/AIDC-AI/Pixelle-MCP

unsetunset添加自己的MCP Toolunsetunset

  • 一个工作流即为提个MCP Tool
  1. 添加最简单的MCP Tool 📝 在ComfyUI中搭建一个实现图片高斯模糊的工作流:(https://github.com/AIDC-AI/Pixelle-MCP/blob/main/docs/i_blur_ui.json),然后将 LoadImage 节点的 title 改为 $image.image!,如下图
  • 然后将其导出为api格式文件,并重命名为 i_blur.json,你可以自己导出,也可以直接使用我们为你导出好的(点击获取)

  • 复制导出的API格式工作流文件(注:务必是API格式的),在web页面输入,并LLM添加这个Tool

  • 消息发送后,LLM会让将这个工作流自动转化为一个MCP Tool
  • 此时,刷新页面,再发送任意图片,即可实现基于LLM进行的高斯模糊处理

unsetunset项目结构unsetunset

  • mcp-base: 基础服务,提供文件存储和共用服务能力
  • mcp-client: MCP 客户端,基于 Chainlit 构建的 Web 界面
  • mcp-server: MCP 服务端,提供各种 AIGC 工具和服务

unsetunset快速开始unsetunset

1. 克隆源码 & 配置服务

1.1 克隆源码

git clone https://github.com/AIDC-AI/Pixelle-MCP.git cd Pixelle-MCP

1.2 配置服务 项目采用统一的 YAML 配置方案:

# 复制配置示例文件
# 或者直接复制一份并修改名字
cp config.yml.example config.yml
# 根据需要修改配置项
# 复制配置示例文件
# 或者直接复制一份并修改名字
cp config.yml.example config.yml
# 根据需要修改配置项

详细配置说明:

配置文件包含三个主要部分:基础服务、MCP服务端、MCP客户端。在 config.yml.example 中每个部分都有详细的配置项说明。

  • 配置检查清单:

  • ✅ 已复制 config.yml.example 为 config.yml

  • ✅ 已配置 ComfyUI 服务地址(确保ComfyUI正在运行)

  • ✅ 已配置至少一个LLM模型(OpenAI或Ollama)

  • ✅ 端口号未被其他服务占用(9001, 9002, 9003)

2. 添加MCP Tool(可选)

这一步是可选的,只会决定你Agent的能力,不影响正常对话,如果你暂时不需要,可以先跳过。

mcp-server/workflows中是我们默认提供的一套目前比较热门的工作流,运行如下命令可以将其拷贝到你的mcp-server中,服务启动时会自动将其转化为MCP Tool,供大模型调用。

注:这里强烈建议在拷贝之前,先将工作流拖进你的ComfyUI画布试运行,以确保后续调用过程中能够顺利执行。

cp -r mcp-server/workflows/* mcp-server/data/custom_workflows/

3. 启动服务(任选其一)

3.1 Docker方式启动(推荐)

# 启动所有服务
docker compose up -d

3.2 一键脚本启动 需要先安装 uv 环境。

  • Linux/macOS 用户:
# 启动所有服务(前台运行)
./run.sh
# 或
# 启动所有服务(后台运行)
./run.sh start --daemon
  • 启动服务端(mcp-server):
cd mcp-server
# 安装依赖(仅首次或更新时需要)
uv sync
# 启动服务
uv run main.py
  • 启动客户端(mcp-client):
cd mcp-client
# 安装依赖(仅首次或更新时需要)
uv sync
# 启动服务(开发模式需要热更新时,运行:uv run chainlit run main.py -w --port 9003)
uv run main.py

4. 访问服务

启动完成后,各服务地址如下:

  • 客户端: 🌐 http://localhost:9003 (Chainlit Web UI,默认用户名密码均为dev,可以在 auth.py 中更改)
  • 服务端: 🗄️ http://localhost:9002/sse (MCP Server)
  • 基础服务: 🔧 http://localhost:9001/docs (文件存储和基础API)

感谢你看到这里,添加小助手 AIGC_Tech 加入官方 AIGC读者交流群,下方扫码加入 AIGC Studio 星球,获取前沿AI应用、AIGC实践教程、大厂面试经验、AI学习路线以及IT类入门到精通学习资料等,欢迎一起交流学习💗~

【声明】内容源于网络
0
0
AIGC Studio
一个有趣有AI的AIGC公众号:关注AI、深度学习、计算机视觉、AIGC、Stable Diffusion、Sora等相关技术。这里不仅有简单易懂的AIGC理论实践和AI学习路线,还有大厂工作经历和体会分享。如果有幸能给你一些帮助就更好啦!
内容 876
粉丝 0
AIGC Studio 一个有趣有AI的AIGC公众号:关注AI、深度学习、计算机视觉、AIGC、Stable Diffusion、Sora等相关技术。这里不仅有简单易懂的AIGC理论实践和AI学习路线,还有大厂工作经历和体会分享。如果有幸能给你一些帮助就更好啦!
总阅读44
粉丝0
内容876