洞见畏来

2025-08-20

导读：阿里新出AI修图工具！秒级出效果，还能免费用，Photoshop遇劲敌？

作为全球超90%创意从业者都在使用的经典软件，Adobe Photoshop一直是图像编辑领域的“标杆”。但就在2025年8月18日，阿里巴巴Qwen团队推出的开源AI模型——Qwen-Image Edit，凭借纯文本驱动的修图能力，正式向这一标杆发起挑战，短短几秒就能完成大量类似Photoshop的编辑任务，引发行业关注。

一、核心能力：文本输指令，秒出修图结果

Qwen-Image Edit并非凭空诞生，它基于本月初发布的200亿参数Qwen-Image基础模型开发，最大亮点是将后者在文本渲染上的优势，延伸到了全场景图像编辑中。

使用方式格外简单：上传一张原始图片，输入文字指令描述修改需求，模型就能快速返回编辑后的图像。比如上传一张人物照，输入“让这个人穿上晚礼服”，几秒内就能得到人物身着礼服的新图。

更关键的是，它能兼顾“语义”与“视觉”双重需求——既理解文字指令的核心意图，又能最大程度保留原图的风格和细节，这背后依赖于Qwen-Image的双编码机制：

一方面通过Qwen2.5-VL模型把控语义，确保编辑符合指令逻辑（比如把曼哈顿街景改成乐高风格，属于语义层面的场景转换）；
另一方面借助变分自动编码器（VAE）还原细节，让修改不破坏原图质感（比如移除人像上的一根发丝，或给水面中的招牌添加倒影，都属于高精度外观调整）。

此外，它还解决了AI修图的一大痛点——双语文本编辑。无论是中文还是英文，都能精准添加、删除或修改图片中的文字，同时保留原有字体、大小和风格。比如修正书法作品中的错字、修改海报上的宣传语，甚至调整T恤印花的文字，都能做到细节无误。

二、适用场景：从专业创作到日常修图，覆盖全需求

Qwen-Image Edit的灵活性，让它能满足不同人群的需求，官方也明确了几大核心应用方向：

创意设计与IP开发：比如基于品牌 mascot 生成整套表情包，或把2D角色转换成吉卜力风格插画；
广告与内容制作：快速定制海报上的logo、调整宣传物料的文字信息，无需反复修改图层；
虚拟形象与艺术创作：支持风格迁移，能让虚拟 avatar 切换不同艺术风格，打造独特视觉效果；
日常摄影修图：普通人也能轻松调整照片背景、修改衣物款式，或删除画面中的多余物体；
文化遗产保护：比如对古典书法作品进行数字化修正，还原文字原本面貌。

三、使用方式：多平台可享，免费额度+低价API

目前Qwen-Image Edit已在多个平台上线，不同需求的用户都能找到适配方式：

1. 普通用户：免费试用，简单易上手

可通过Qwen Chat（类似ChatGPT的对话平台）直接使用，上传图片+输指令即可生成；
免费额度：每12小时可完成约8次编辑任务，超时后自动重置；付费用户可解锁更多次数；
额外支持：同时兼容中英文指令，无需担心语言障碍。

2. 开发者/企业：开源+API，低成本集成

开源部署：模型基于Apache 2.0协议开源，可在Hugging Face、ModelScope、GitHub下载代码，免费部署到自有硬件或云服务器，相比Photoshop能大幅节省软件成本；
API调用：通过阿里云Model Studio获取API，适合集成到自有应用中：
价格：每张图片编辑仅需0.045美元；
免费福利：激活后可获得100张免费编辑额度，有效期180天；
使用限制：目前仅支持新加坡地区，每秒最多5次请求，每个账号最多2个并发任务；
技术要求：支持通过HTTP请求，或Python/Java的DashScope SDK调用，图片可提交URL或Base64格式，支持512-4096像素分辨率、最大10MB文件，输出链接24小时内有效，需及时保存。

四、行业意义：AI修图从“生成”走向“精修”

Qwen团队表示，Qwen-Image Edit的推出，本质是让专业级图像编辑的门槛变得更低——无论是设计师需要精准调整画面，还是普通人想修图发社交平台，都能通过简单文字指令实现。

这也反映了AI发展的新趋势：从单一的“生成内容”，转向“生成+编辑+优化”的全流程工具。相比传统修图软件需要掌握复杂操作，Qwen-Image Edit用AI简化了步骤，却保留了专业级的精度，或许会成为未来图像编辑领域的“新主流”。

目前该工具已开放试用，感兴趣的朋友可以去Qwen Chat体验，或通过阿里云了解API接入方式，亲测一下“秒级AI修图”的效率～

【声明】内容源于网络

洞见畏来

专注于前沿科技趋势，剖析底层算法逻辑，深耕商业化场景落地

内容 633

粉丝 0

洞见畏来专注于前沿科技趋势，剖析底层算法逻辑，深耕商业化场景落地

总阅读228

粉丝0

内容633