设计师集体沸腾！阿里开源千问图像编辑模型，支持语义及外观的双重编辑！ - 文章 - 开发者社区

在图像编辑领域，精准修改文字和保持语义一致性是两大难题，尤其涉及中英文混排或书法场景。

阿里最新放出的 Qwen-Image-Edit ，在图像编辑上带来了颠覆式突破。

picture.image

它不仅支持常规的视觉编辑（添加、删除、替换元素），还能同时进行语义和外观双重编辑。更厉害的是，它能精准修改图片里的文字内容，并保持原有字体、字号和风格，中英文都能无缝支持。

Qwen-Image-Edit 是由阿里Qwen团队于2025年8月18日发布，基于20亿参数的 Qwen-Image 模型，结合Qwen2.5-VL和变分自编码器（VAE），实现语义和外观双重编辑，特别擅长文字修改（尤其中文方面）以及IP创作、物体旋转和风格转换。

目前已上线Qwen Chat，并且在魔搭及Hugging Face都有体验版本，皆可免费使用。

picture.image

核心功能

• 精准中英文文本编辑 ：支持中英文文字修改，保留原始字体、字号、风格。
• 语义一致性编辑 ：保持IP一致性，支持物体旋转、风格转换。
• 视觉外观编辑 ：添加、删除、修改元素，保持图像整体不变。
• 多场景支持 ：海报设计、书法修复、IP创作等。
• 开源部署 ：支持Hugging Face、ModelScope、Diffusers。

快速入手

官方提供有2种在线方式，可直接免费使用。

QwenChat：https://chat.qwen.ai/?inputFeature=image\_edit

HF：https://huggingface.co/spaces/Qwen/Qwen-Image

我们就以官方QwenChat，来直接体验，打开QwenChat登录后，点击图片编辑即可。

picture.image

然后我们上传要修改的图片，填写编辑描述词。比如将下面图片中的哪吒敖丙草图上的文字互换。

picture.image

整体效果还是不错的，文字风格也保留了，就是字体颜色有些瑕疵，也可能好似哪吒橙色字体显示不完整的因素导致。

除了在线方式外，有条件的小伙伴也可以通过源码调用方式。

在自己的Python虚拟环境，安装最新Diffusers。


 
 
 
 
   
pip install git+https://github.com/huggingface/diffusers

编写图像编辑代码，直接在代码中加载Qwen-Image-Edit模型，并编写好提示词。


 
 
 
 
   
import os  
from PIL import Image  
import torch  
  
from diffusers import QwenImageEditPipeline  
  
pipeline = QwenImageEditPipeline.from\_pretrained("Qwen/Qwen-Image-Edit")  
print("pipeline loaded")  
pipeline.to(torch.bfloat16)  
pipeline.to("cuda")  
pipeline.set\_progress\_bar\_config(disable=None)  
  
image = Image.open("./input.png").convert("RGB")  
prompt = "Change the rabbit's color to purple, with a flash light background."  
  
  
inputs = {  
    "image": image,  
    "prompt": prompt,  
    "generator": torch.manual\_seed(0),  
    "true\_cfg\_scale": 4.0,  
    "negative\_prompt": " ",  
    "num\_inference\_steps": 50,  
}  
  
with torch.inference\_mode():  
    output = pipeline(**inputs)  
    output\_image = output.images[0]  
    output\_image.save("output\_image\_edit.png")  
    print("image saved at", os.path.abspath("output\_image\_edit.png"))