
Qwen Image 2 Pro:文生图与图像编辑
Qwen Image 2 Pro 是阿里巴巴的高端统一图像生成与编辑模型,拥有 70 亿参数,具备强大的写实能力、精准的文字渲染和复杂提示词遵循能力。
Qwen Image 2 Pro 是阿里巴巴统一图像生成与编辑模型的高端版本。它与 Qwen Image 2 采用相同的架构——一个 70 亿参数的模型,结合了 80 亿参数的 Qwen3-VL 编码器和 70 亿参数的扩散解码器——但针对更强的写实效果、更准确的文字渲染以及更好的复杂提示词遵循进行了调优。
如果你正在制作营销素材、产品视觉图,或任何需要文字拼写正确、版面布局稳定的内容,Pro 版本是你的首选。
擅长领域
文字渲染与排版。 Pro 模型在图像中渲染可读、拼写正确的文字方面尤为出色。电影海报、信息图表、幻灯片、标牌、标签——它能处理包含多个文本块、多列和视觉层次的复杂排版。提示词最长可达 1,000 个 token,因此你可以描述详细的排版布局。

照片级写实。 在皮肤、头发、纹理、自然材质和光照方面呈现精细的细节。模型以原生 2K 分辨率(最高 2048×2048)生成图像,无需依赖放大即可获得清晰的输出。

图像编辑。 传入参考图片和文字提示词,即可进行编辑、重新风格化或变换。风格迁移、物体操作、光照调整、跨域编辑——都在同一个模型中完成。使用 match_input_image 可保持输出与输入图片相同的分辨率和宽高比。
输入参数
- prompt — 你想生成的内容或编辑图像的方式。为获得最佳效果,先描述结构再描述风格。
- image — 可选的参考图像,用于编辑或风格迁移。
- match_input_image — 设为 true 且提供了图像时,输出将匹配输入图像的宽高比和分辨率,而非使用 aspect_ratio 参数。
- aspect_ratio — 输出图像的形状。选项:
1:1、16:9、9:16、4:3、3:4、3:2、2:3、2:1、1:2。默认为1:1。 - enable_prompt_expansion — 自动扩展和优化你的提示词。默认开启。
- negative_prompt — 描述你不希望出现在图像中的内容。
- seed — 用于生成可复现的结果。范围:0–2147483647。
使用技巧
- 先写结构,后写风格。 先描述布局("顶部大标题,画面中央孤独身影,下方是外星景观"),再添加美学方向("电影感光照,柔和的色调")。
- 对文字内容要具体。 包含准确的字符串、大小写、字体风格提示和位置信息。Pro 模型在处理文字方面比标准版更可靠,但具体的描述仍然有帮助。
- 想要写实效果,提示相机参数。 "中画幅"、"85mm 人像镜头"、"黄金时刻"——轻度的技术提示可以提升写实感,而不会过度约束结果。
- 编辑时,明确说明约束条件。 "不要改变背景"或"保持原始配色方案"——模型对明确的约束比暗示的约束遵循得更好。
- 复杂编辑使用编号指令。 当组合多项更改时,给它们编号。模型对有序的约束列表处理得更可靠。
标准版 vs Pro 版
Pro 版本生成更高质量的输出,具有更好的文字准确性、更强的写实效果和更好的提示词遵循能力。生成时间略长。如果你需要更快、更经济的生成,且不需要额外的质量提升,可以尝试标准版 Qwen Image 2。
Qwen Image 2 Pro 采用 Apache 2.0 许可证。你可以在 Qwen 团队的博客文章和 API 文档中了解更多关于该模型的信息。

