阿里“干掉”PS了,深夜正式开源

整理如下(SEO优化版,):

阿里推出Qwen-Image-Edit:AI图像编辑新突破,挑战传统PS?

近日,阿里巴巴正式发布了全新图像编辑模型 Qwen-Image-Edit,这是其此前推出的图像生成模型 Qwen-Image(20B参数)的进阶版本。该模型不仅继承了Qwen-Image强大的文本生成能力,还在图像编辑领域实现了多项突破,包括语义理解、外观控制和中英文文字精准编辑等。

与传统图像编辑工具如Photoshop相比,Qwen-Image-Edit通过自然语言指令即可完成复杂编辑任务,极大降低了图像创作的技术门槛。例如,用户只需输入“在图中添加一个写着‘Welcome to Penguin Beach’的指示牌”,系统即可在指定位置生成符合场景的文本,甚至能生成自然的倒影效果。

Qwen-Image-Edit核心技术亮点

Qwen-Image-Edit基于Qwen-Image 20B模型进一步训练,融合了Qwen2.5-VL(视觉语义控制)和VAE Encoder(视觉外观控制)两个关键模块,使其具备双重编辑能力:

1. 语义与外观双重编辑能力
该模型不仅支持低阶视觉元素的增删改(如添加或删除图像中的对象),还支持高阶语义层面的编辑,例如IP形象创作、物体旋转、风格迁移等,确保图像整体语义不变的同时,实现灵活创作。

2. 中英文文字精准编辑
Qwen-Image-Edit支持对图片中的中英文文字进行修改、添加或删除,保留原有字体风格和排版布局,尤其在中文复杂字体处理上表现优异。

3. SOTA级图像编辑性能
在多个公开图像编辑基准测试中,Qwen-Image-Edit展现出领先的性能表现,成为当前图像编辑领域的顶尖模型之一。

用户可通过 Qwen Chat 平台体验该功能,也可在 ModelScope、Hugging Face 和 GitHub 上获取相关模型资源。

实测体验:从IP创作到文字修改,编辑能力全面

在实际测试中,Qwen-Image-Edit展现了强大的图像编辑能力。例如,输入一张小兔子的图片并提示“让小兔子拿着画笔画画”,模型能准确生成画面,并保持原有风格一致。进一步要求“为小兔子穿上写着‘智东西’的短袖,画板上写上‘AGI’”,系统也能精准完成,文字排版自然,风格统一。

此外,Qwen-Image-Edit还能实现视角切换、背景替换等操作。例如将一张女孩照片的背景替换为“高原雪山”,人物光影也随之自然变化,整体画面过渡自然,毫无违和感。

阿里官方还展示了多个吉祥物“水豚”的编辑案例,通过语义编辑生成不同场景下的IP形象,可用于表情包、虚拟角色等创意创作。

外观编辑:细节处理更精细

在外观编辑方面,Qwen-Image-Edit同样表现出色。例如,系统可以精准地从图像中去除细小物体(如头发丝)、修改特定字母的颜色,甚至添加广告牌等元素并生成逼真的反射效果。

这些功能在虚拟展示、产品模拟、服装换装等场景中具有广泛的应用前景。

链式文字编辑:逐步修正书法错误

得益于Qwen-Image在文本渲染方面的积累,Qwen-Image-Edit在文字编辑方面也具备强大能力。用户可以直接对图片中的海报、书法作品等进行修改,包括大标题和细小文字。

在一次书法作品的修正测试中,用户通过多次框选和提示指令,逐步纠正了“稽”“亭”等字的书写错误,最终成功生成了完整的《兰亭集序》书法作品。

虽然在处理草书等复杂字体时仍有一定挑战,但这种“链式编辑”方式大大提升了文字修改的灵活性和准确性。

总结:AI图像编辑进入新阶段

总体来看,Qwen-Image-Edit在图像编辑领域展现出了强大的技术实力。尽管在多轮编辑中仍存在一定的精度下降问题,且免费使用次数有限,但其在语义理解、外观控制和文字编辑等方面的综合表现,已经能够满足大部分图像创作需求。

随着模型的不断优化与迭代,Qwen-Image-Edit有望进一步降低视觉创作门槛,推动AI在设计、广告、教育、IP开发等领域的广泛应用。

Qwen-Image-Edit, 图像编辑AI, 阿里AI模型, 中文文本渲染, AI图像生成工具

本文来源: 智东西【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...