阿里“干掉”PS了，深夜正式开源

阿里推出Qwen-Image-Edit：AI图像编辑新突破，挑战传统PS？

近日，阿里巴巴正式发布了全新图像编辑模型 Qwen-Image-Edit，这是其此前推出的图像生成模型 Qwen-Image（20B参数）的进阶版本。该模型不仅继承了Qwen-Image强大的文本生成能力，还在图像编辑领域实现了多项突破，包括语义理解、外观控制和中英文文字精准编辑等。

与传统图像编辑工具如Photoshop相比，Qwen-Image-Edit通过自然语言指令即可完成复杂编辑任务，极大降低了图像创作的技术门槛。例如，用户只需输入“在图中添加一个写着‘Welcome to Penguin Beach’的指示牌”，系统即可在指定位置生成符合场景的文本，甚至能生成自然的倒影效果。

Qwen-Image-Edit核心技术亮点

Qwen-Image-Edit基于Qwen-Image 20B模型进一步训练，融合了Qwen2.5-VL（视觉语义控制）和VAE Encoder（视觉外观控制）两个关键模块，使其具备双重编辑能力：

1. 语义与外观双重编辑能力
该模型不仅支持低阶视觉元素的增删改（如添加或删除图像中的对象），还支持高阶语义层面的编辑，例如IP形象创作、物体旋转、风格迁移等，确保图像整体语义不变的同时，实现灵活创作。

2. 中英文文字精准编辑
Qwen-Image-Edit支持对图片中的中英文文字进行修改、添加或删除，保留原有字体风格和排版布局，尤其在中文复杂字体处理上表现优异。

3. SOTA级图像编辑性能
在多个公开图像编辑基准测试中，Qwen-Image-Edit展现出领先的性能表现，成为当前图像编辑领域的顶尖模型之一。

用户可通过 Qwen Chat 平台体验该功能，也可在 ModelScope、Hugging Face 和 GitHub 上获取相关模型资源。

实测体验：从IP创作到文字修改，编辑能力全面

在实际测试中，Qwen-Image-Edit展现了强大的图像编辑能力。例如，输入一张小兔子的图片并提示“让小兔子拿着画笔画画”，模型能准确生成画面，并保持原有风格一致。进一步要求“为小兔子穿上写着‘智东西’的短袖，画板上写上‘AGI’”，系统也能精准完成，文字排版自然，风格统一。

此外，Qwen-Image-Edit还能实现视角切换、背景替换等操作。例如将一张女孩照片的背景替换为“高原雪山”，人物光影也随之自然变化，整体画面过渡自然，毫无违和感。

阿里官方还展示了多个吉祥物“水豚”的编辑案例，通过语义编辑生成不同场景下的IP形象，可用于表情包、虚拟角色等创意创作。

外观编辑：细节处理更精细

在外观编辑方面，Qwen-Image-Edit同样表现出色。例如，系统可以精准地从图像中去除细小物体（如头发丝）、修改特定字母的颜色，甚至添加广告牌等元素并生成逼真的反射效果。