Qwen-Image-Edit 发布:20B 基座,中英双语精准改字与语义/外观级图像编辑全解析。Qwen-Image-Edit 是在 20B 规模 Qwen-Image 基座上推出的图像编辑模型。该模型支持中文与英文的精准文本编辑,强调在保留原有字体与版式的前提下进行“增删改”。模型同时支持语义级编辑(如对象旋转、风格迁移、IP 连续创作)与外观级编辑(如加/删/改物体、换色、换背景、细节修复),并提供在线体验、开源权重与云端 API 接入。
一、核心能力
1)双语文本编辑:支持在图片中新增、删除、替换中文与英文文本,尽量保持原有字体、字号与风格一致。
2)语义级编辑:支持对象 90°/180° 视角旋转、风格迁移、角色一致性与 IP 连续创作,强调语义保持与整体风格一致。
3)外观级编辑:支持在保持无关区域不变的前提下进行加/删/改、换色、换背景、去除杂物与细节修补。
4)管线思路(据官方材料):输入图像同时送入视觉语义控制与外观重建通道,以平衡“内容一致性”与“像素保真”。
5)生态完整:提供网页端体验、开源模型与推理示例,以及面向生产的云端 API。
二、适用场景
- 电商/品牌:海报错字直接改、跨语种本地化、促销海报快速更新。
- 社媒/短视频:风格迁移、表情包与虚拟形象批量生成。
- 平面设计:招牌新增并生成真实反射、去除杂物、局部细节修复。
- 影像后期:人物换装、换背景、姿态与视角调优。
三、快速上手(在线与本地)
1)在线体验:在官方聊天入口选择“Image Editing”,上传图片并用中英文描述修改需求即可生成结果。
2)Hugging Face 推理:提供 QwenImageEditPipeline
的本地推理示例,可在 GPU 环境下加载权重,输入 image + prompt
并配置步数、随机种子、负向提示等参数。
3)ModelScope:同步提供模型页与体验入口,便于国内网络环境下访问与下载。
四、阿里云 Model Studio API 接入要点
- 模型名:
qwen-image-edit
。 - 接口路径:国际站 HTTP 接口支持多模态生成服务,采用 JSON 请求体与 Bearer API Key 鉴权。
- 输入结构:
input.messages[0].content
包含{"image": "<URL 或 Base64>"}
与{"text": "<中英文提示词>"}
。 - 字段约束:正向提示
text
最长约 800 字符;负向提示negative_prompt
最长约 500 字符;可启用prompt_extend
的智能改写;watermark
控制右下角“Qwen-Image”水印开关。 - 图片限制:JPG/JPEG/PNG/BMP/TIFF/WEBP;宽高 512–4096;单图 ≤10MB;URL 不可包含中文;结果链接有效期 24 小时。
- 计费与限流(新加坡区):约 0.045 美元/图;免费额度 100 张(激活后 180 天内有效);提交 RPS=5,并发=2。
- 返回结果:输出为含图片链接的结构化结果;建议业务侧落地后立即下载并转存自有存储。
五、实操与工作流建议
1)链式编辑更稳:将复杂目标拆解为多步微调(先框选、逐字/逐区修正),逐步收敛到期望效果。
2)区域化控制优先:对外观级修改,先圈定需修改或需保持不变的区域,降低无关像素漂移。
3)提示词要可验证:明确对象、位置、颜色、数量、风格;必要时配合负向提示排除不希望出现的元素。
4)缓存与容错:云端结果链接时效有限,需结合对象存储、白名单与重试队列设计下载与缓存策略。
5)团队协作:将“文本编辑”“语义编辑”“外观编辑”分为不同模版,方便运营与设计协同复用。
六、对比与定位(据官方与社区材料)
- 中文文本编辑友好:在中文小字号与复杂排版场景中具备较强保形能力。
- 语义+外观双重控制思路:同时盯住“内容一致性”与“区域不变性”,降低风格漂移风险。
- 生态覆盖:网页 Demo、开源权重与企业级 API 并行,缩短从体验到落地的路径。
七、局限与风险提示
- 基准成绩与“SOTA”表述来自官方材料,真实业务需在自有样本上验证鲁棒性。
- 极端场景(超小字号、强透视/强反射、复杂背景)可能失败,需多次链式微调。
- 涉及商标、人物肖像、特定风格与 IP,务必遵守版权与平台规范。
Q&A 常见问题
Q:Qwen-Image-Edit 能解决什么核心问题?
A:Qwen-Image-Edit 解决图片内中英文“改字”的可用性问题,并在语义级与外观级编辑之间实现兼顾。
Q:在线如何体验?
A:在官方聊天入口选择“Image Editing”,上传图片并输入中英文修改指令即可开始体验。
Q:本地如何推理?
A:在 Hugging Face 加载 QwenImageEditPipeline
,输入 image + prompt
,可配置步数、负向提示、随机种子等参数。
Q:云端 API 关键参数有哪些?
A:需提供 model=qwen-image-edit
、messages
中的 image
与 text
;可选 negative_prompt
、prompt_extend
、watermark
;图片需满足格式、尺寸与大小限制。
Q:价格与配额如何计算?
A:新加坡区价格约 0.045 美元/图;免费额度 100 张(激活后 180 天内有效);提交 RPS=5,并发=2。
Q:链接为什么会过期?
A:云端返回的图片链接有效期为 24 小时,需尽快下载并转存到自有存储。
参考资料
官方博客(英文/含中文译文):https://qwenlm.github.io/blog/qwen-image-edit/
Hugging Face 模型卡(含 QwenImageEditPipeline
示例与许可证):https://huggingface.co/Qwen/Qwen-Image-Edit
Hugging Face 在线 Demo(Space):https://huggingface.co/spaces/Qwen/Qwen-Image-Edit
阿里云 Model Studio · Qwen-Image-Edit(API/价格/参数/示例):https://www.alibabacloud.com/help/en/model-studio/qwen-image-edit
Qwen Chat(图像编辑入口):https://chat.qwen.ai/?inputFeature=image_edit
GitHub · Qwen-Image 仓库(Apache-2.0):https://github.com/QwenLM/Qwen-Image
Qwen-Image 技术报告(arXiv):https://arxiv.org/abs/2508.02324
ModelScope 模型页:https://modelscope.cn/models/Qwen/Qwen-Image-Edit