
2026/03/11
Qwen Image 2:统一的文生图与图像编辑模型
Qwen Image 2 是阿里巴巴的统一图像生成与编辑模型,拥有 70 亿参数,具备可靠的文字渲染、高保真写实效果和原生 2K 分辨率输出。
Qwen Image 2 是阿里巴巴 Qwen 团队推出的统一图像生成与编辑模型。它在同一个模型中同时支持文生图和图像编辑,专注于可靠的文字渲染和高保真写实效果。
该模型采用 70 亿参数架构——由 80 亿参数的 Qwen3-VL 编码器和 70 亿参数的扩散解码器组成——以原生 2K 分辨率(最高 2048×2048)生成图像。目前在 AI Arena 的盲评排行榜上,生成和编辑两项均排名第一。
擅长领域
文字渲染。 该模型能在图像中渲染可读的文字——标题、标签、标牌、海报、信息图表。支持最长 1,000 个 token 的提示词,尤其擅长中文文字渲染。

照片级写实。 该模型能在常见类别中生成细节丰富的写实图像:人物(皮肤、头发、服装纹理)、自然场景(植被、水面、大气效果)以及建筑(材质、几何、光照)。自然材质和光照方面的精细细节尤为出色。

图像编辑。 传入参考图片和文字提示词,即可进行编辑、重新风格化或变换。风格迁移、元素添加/移除、光照调整、跨域编辑——都在同一个模型中完成。使用 match_input_image 可保持输出与输入图片相同的分辨率和宽高比。
输入参数
- prompt — 你想生成的内容或编辑图像的方式。为获得最佳效果,先描述结构再描述风格。
- image — 可选的参考图像,用于编辑或风格迁移。
- match_input_image — 设为 true 且提供了图像时,输出将匹配输入图像的宽高比和分辨率,而非使用 aspect_ratio 参数。
- aspect_ratio — 输出图像的形状。选项:
1:1、16:9、9:16、4:3、3:4、3:2、2:3、2:1、1:2。默认为1:1。 - enable_prompt_expansion — 自动扩展和优化你的提示词。默认开启。
- negative_prompt — 描述你不希望出现在图像中的内容。
- seed — 用于生成可复现的结果。范围:0–2147483647。
使用技巧
- 先写结构,后写风格。 先描述布局("顶部大标题,画面中央孤独身影,下方是城市景观"),再添加美学方向("电影感光照,柔和的色调")。
- 对文字内容要具体。 包含准确的字符串、语言、大小写和对齐方式。模型对中文文字处理尤为出色,但具体的描述对所有语言都有帮助。
- 想要写实效果,提示相机参数。 "50mm 镜头"、"柔和日光"、"中画幅"——轻度的技术提示可以提升写实感,而不会过度约束结果。
- 编辑时,明确说明约束条件。 "不要改变背景"或"保持光照的真实感"——模型对明确的约束比暗示的约束遵循得更好。
标准版 vs Pro 版
Qwen Image 2 是该模型的标准版本。如果你需要更强的写实效果、更准确的文字渲染和更好的复杂提示词遵循能力,可以尝试 Pro 版本——Qwen Image 2 Pro。Pro 版本生成时间略长,但输出质量更高。
Qwen Image 2 采用 Apache 2.0 许可证。你可以在 Qwen 团队的博客文章和 API 文档中了解更多关于该模型的信息。

