Qwen Image 2：统一的文生图与图像编辑模型

2026/03/11

Qwen Image 2：统一的文生图与图像编辑模型

Qwen Image 2 是阿里巴巴的统一图像生成与编辑模型，拥有 70 亿参数，具备可靠的文字渲染、高保真写实效果和原生 2K 分辨率输出。

Qwen Image 2 是阿里巴巴 Qwen 团队推出的统一图像生成与编辑模型。它在同一个模型中同时支持文生图和图像编辑，专注于可靠的文字渲染和高保真写实效果。

该模型采用 70 亿参数架构——由 80 亿参数的 Qwen3-VL 编码器和 70 亿参数的扩散解码器组成——以原生 2K 分辨率（最高 2048×2048）生成图像。目前在 AI Arena 的盲评排行榜上，生成和编辑两项均排名第一。

擅长领域

文字渲染。 该模型能在图像中渲染可读的文字——标题、标签、标牌、海报、信息图表。支持最长 1,000 个 token 的提示词，尤其擅长中文文字渲染。

东京旅行海报，文字精准渲染

照片级写实。 该模型能在常见类别中生成细节丰富的写实图像：人物（皮肤、头发、服装纹理）、自然场景（植被、水面、大气效果）以及建筑（材质、几何、光照）。自然材质和光照方面的精细细节尤为出色。

玫瑰花瓣上的露珠——照片级写实细节

图像编辑。 传入参考图片和文字提示词，即可进行编辑、重新风格化或变换。风格迁移、元素添加/移除、光照调整、跨域编辑——都在同一个模型中完成。使用 match_input_image 可保持输出与输入图片相同的分辨率和宽高比。

输入参数

prompt — 你想生成的内容或编辑图像的方式。为获得最佳效果，先描述结构再描述风格。
image — 可选的参考图像，用于编辑或风格迁移。
match_input_image — 设为 true 且提供了图像时，输出将匹配输入图像的宽高比和分辨率，而非使用 aspect_ratio 参数。
aspect_ratio — 输出图像的形状。选项：1:1、16:9、9:16、4:3、3:4、3:2、2:3、2:1、1:2。默认为 1:1。
enable_prompt_expansion — 自动扩展和优化你的提示词。默认开启。
negative_prompt — 描述你不希望出现在图像中的内容。
seed — 用于生成可复现的结果。范围：0–2147483647。

使用技巧

先写结构，后写风格。 先描述布局（"顶部大标题，画面中央孤独身影，下方是城市景观"），再添加美学方向（"电影感光照，柔和的色调"）。
对文字内容要具体。 包含准确的字符串、语言、大小写和对齐方式。模型对中文文字处理尤为出色，但具体的描述对所有语言都有帮助。
想要写实效果，提示相机参数。 "50mm 镜头"、"柔和日光"、"中画幅"——轻度的技术提示可以提升写实感，而不会过度约束结果。
编辑时，明确说明约束条件。 "不要改变背景"或"保持光照的真实感"——模型对明确的约束比暗示的约束遵循得更好。

标准版 vs Pro 版

Qwen Image 2 是该模型的标准版本。如果你需要更强的写实效果、更准确的文字渲染和更好的复杂提示词遵循能力，可以尝试 Pro 版本——Qwen Image 2 Pro。Pro 版本生成时间略长，但输出质量更高。

Qwen Image 2 采用 Apache 2.0 许可证。你可以在 Qwen 团队的博客文章和 API 文档中了解更多关于该模型的信息。

作者

Qwen Image 团队

分类

擅长领域输入参数使用技巧标准版 vs Pro 版

更多文章

Qwen Image 2 Pro：文生图与图像编辑

Qwen Image 2 Pro：文生图与图像编辑

Qwen Image 2 Pro 是阿里巴巴的高端统一图像生成与编辑模型，拥有 70 亿参数，具备强大的写实能力、精准的文字渲染和复杂提示词遵循能力。

Qwen Image 团队

Qwen Image Edit Plus：多图编辑与 ControlNet 支持

Qwen Image Edit Plus：多图编辑与 ControlNet 支持

Qwen Image Edit Plus 是阿里巴巴的 200 亿参数图像编辑模型，支持改进的多图编辑、人物一致性、产品海报生成以及原生 ControlNet 控制。

Qwen Image 团队

Qwen Image 2：统一的文生图与图像编辑模型 | Qwen Image - 免费AI图像生成器 | Qwen AI创作