作为全球超90%创意从业者都在使用的经典软件,Adobe Photoshop一直是图像编辑领域的“标杆”。但就在2025年8月18日,阿里巴巴Qwen团队推出的开源AI模型——Qwen-Image Edit,凭借纯文本驱动的修图能力,正式向这一标杆发起挑战,短短几秒就能完成大量类似Photoshop的编辑任务,引发行业关注。
一、核心能力:文本输指令,秒出修图结果
Qwen-Image Edit并非凭空诞生,它基于本月初发布的200亿参数Qwen-Image基础模型开发,最大亮点是将后者在文本渲染上的优势,延伸到了全场景图像编辑中。
使用方式格外简单:上传一张原始图片,输入文字指令描述修改需求,模型就能快速返回编辑后的图像。比如上传一张人物照,输入“让这个人穿上晚礼服”,几秒内就能得到人物身着礼服的新图。
更关键的是,它能兼顾“语义”与“视觉”双重需求——既理解文字指令的核心意图,又能最大程度保留原图的风格和细节,这背后依赖于Qwen-Image的双编码机制:
一方面通过Qwen2.5-VL模型把控语义,确保编辑符合指令逻辑(比如把曼哈顿街景改成乐高风格,属于语义层面的场景转换);
另一方面借助变分自动编码器(VAE)还原细节,让修改不破坏原图质感(比如移除人像上的一根发丝,或给水面中的招牌添加倒影,都属于高精度外观调整)。
此外,它还解决了AI修图的一大痛点——双语文本编辑。无论是中文还是英文,都能精准添加、删除或修改图片中的文字,同时保留原有字体、大小和风格。比如修正书法作品中的错字、修改海报上的宣传语,甚至调整T恤印花的文字,都能做到细节无误。
二、适用场景:从专业创作到日常修图,覆盖全需求
Qwen-Image Edit的灵活性,让它能满足不同人群的需求,官方也明确了几大核心应用方向:
创意设计与IP开发:比如基于品牌 mascot 生成整套表情包,或把2D角色转换成吉卜力风格插画;
广告与内容制作:快速定制海报上的logo、调整宣传物料的文字信息,无需反复修改图层;
虚拟形象与艺术创作:支持风格迁移,能让虚拟 avatar 切换不同艺术风格,打造独特视觉效果;
日常摄影修图:普通人也能轻松调整照片背景、修改衣物款式,或删除画面中的多余物体;
文化遗产保护:比如对古典书法作品进行数字化修正,还原文字原本面貌。
三、使用方式:多平台可享,免费额度+低价API
目前Qwen-Image Edit已在多个平台上线,不同需求的用户都能找到适配方式:
1. 普通用户:免费试用,简单易上手
可通过Qwen Chat(类似ChatGPT的对话平台)直接使用,上传图片+输指令即可生成;
免费额度:每12小时可完成约8次编辑任务,超时后自动重置;付费用户可解锁更多次数;
额外支持:同时兼容中英文指令,无需担心语言障碍。
2. 开发者/企业:开源+API,低成本集成
开源部署:模型基于Apache 2.0协议开源,可在Hugging Face、ModelScope、GitHub下载代码,免费部署到自有硬件或云服务器,相比Photoshop能大幅节省软件成本;
API调用:通过阿里云Model Studio获取API,适合集成到自有应用中:
价格:每张图片编辑仅需0.045美元;
免费福利:激活后可获得100张免费编辑额度,有效期180天;
使用限制:目前仅支持新加坡地区,每秒最多5次请求,每个账号最多2个并发任务;
技术要求:支持通过HTTP请求,或Python/Java的DashScope SDK调用,图片可提交URL或Base64格式,支持512-4096像素分辨率、最大10MB文件,输出链接24小时内有效,需及时保存。
四、行业意义:AI修图从“生成”走向“精修”
Qwen团队表示,Qwen-Image Edit的推出,本质是让专业级图像编辑的门槛变得更低——无论是设计师需要精准调整画面,还是普通人想修图发社交平台,都能通过简单文字指令实现。
这也反映了AI发展的新趋势:从单一的“生成内容”,转向“生成+编辑+优化”的全流程工具。相比传统修图软件需要掌握复杂操作,Qwen-Image Edit用AI简化了步骤,却保留了专业级的精度,或许会成为未来图像编辑领域的“新主流”。
目前该工具已开放试用,感兴趣的朋友可以去Qwen Chat体验,或通过阿里云了解API接入方式,亲测一下“秒级AI修图”的效率~

