
Qwen Image Edit Plus:多图编辑与 ControlNet 支持
Qwen Image Edit Plus 是阿里巴巴的 200 亿参数图像编辑模型,支持改进的多图编辑、人物一致性、产品海报生成以及原生 ControlNet 控制。
Qwen Image Edit Plus 是阿里巴巴 Qwen-Image 编辑模型的最新迭代版本。它接收一张或多张图片以及文字提示词,然后按照你的指令对图片进行编辑。与那些进行广泛、不可预测更改的模型不同,它在微调和大幅变换时都能提供精细的控制。
该模型拥有 200 亿参数,基于 Qwen-Image-Edit 构建,专门针对多图编辑进行训练。最佳效果通常使用 1 到 3 张输入图片。
核心功能
多图编辑。 以创意方式组合多张图片。你可以将人物合成在一起、将人物放置到新场景中,或将产品添加到不同的情境中。模型理解"人物 + 人物"、"人物 + 产品"、"人物 + 场景"等提示词。
例如,你可以拍摄两个人的照片,用"两人一起站在公园里"这样的提示词将他们合成到一个场景中。模型在创建自然的合成画面时,会保持每个人的身份特征。

人物一致性。 模型在不同肖像风格和姿态变换中保持面部身份。这使其非常适合创建一致的角色图像、修复旧照片或制作表情包,同时保持人物的可识别性。
你可以将某人变换成各种艺术风格——如动漫、油画或吉卜力工作室风格——而人物仍然可以被识别。改变姿势、添加文字叠加或修复受损照片,同时保持人物特征不变。

产品海报生成。 将简单的产品照片变成专业海报。模型在添加创意背景和构图的同时保持产品特征。将白色背景的产品照片变换成带有环境场景、灯光效果和品牌元素的精美营销海报。
中英文文字编辑。 直接在图像中编辑文字,同时保留原始字体、大小和风格。你可以修改内容、更换字体、调整颜色或对文字应用不同的材质效果。例如,在海报上将"夏季特卖"改为"冬季特卖"同时保持完全相同的字体和排版,或在招牌上编辑中文字符同时保持书法风格。
ControlNet 支持。 模型支持常见的 ControlNet 条件,如深度图、边缘图和关键点图。你可以使用姿态关键点改变人物的身体姿势,使用深度图保持空间关系,或使用边缘图在编辑时保留结构边界。
工作原理
模型使用两种编辑方式:
外观编辑: 添加、移除或修改特定元素,同时保持其他所有内容完美不变。适用于需要精确、局部更改的场景。
语义编辑: 进行更广泛的创意变换,如风格迁移、姿态变化或 IP 创作。模型可以更新整个图像的像素,只要保留核心含义和内容即可。
典型使用场景
- 角色组合创作 — 将人物的面部、特定服装和目标姿势的独立图片组合成一张统一风格的完整图像。
- 旧照片修复 — 让受损或褪色的照片焕发新生,同时保持人物的身份特征和照片的原始风貌。
- 表情包制作 — 在保持人物身份和图像整体构图的同时,向照片添加文字。
- 海报和营销材料编辑 — 在保持视觉一致性和风格的同时,修改现有海报中的文字和图像。
使用技巧
- 多图编辑时,1 到 3 张输入图片通常效果最佳。超过这个数量,模型可能难以在所有元素之间保持一致性。
- 在提示词中具体说明什么应该改变、什么应该保持不变。例如,"将背景改为海滩,但保持人物的服装完全不变。"
- 文字编辑时,说明你是想保留还是改变字体风格。模型可以匹配现有排版,也可以根据你的描述应用新风格。
- 处理人物时,指明你想保持的具体特征,如"保留面部特征"或"保持相同的发型和表情。"
- 使用清晰、描述性的语言。不要说"让它更好",而是说"增强光照并添加温暖的日落色调。"
- 制作产品海报时,同时描述产品定位和所需的背景或场景。描述越具体,效果越好。
更多信息
如需了解技术细节和完整研究论文,请查看 Qwen Image Edit 文档。Qwen Image Edit Plus 可用于商业用途。

