7 4 月, 2026

阿里巴巴发布Qwen-Image-2.0,提升图像生成技术

qwen-image-2-0-

2月10日,阿里千问宣布推出新一代图像生成基础模型Qwen-Image-2.0。该模型在阿里云百炼上已开通API邀测,开发者也可以通过Qwen Chat(chat.qwen.ai)免费体验新模型。

Qwen-Image-2.0的主要特色在于其作为一个生图编辑二合一的模型,在文生图和图生图基准中均表现出色。阿里千问在AI Arena进行了模型盲测,数据显示该模型在多个任务中取得了优异的性能。

Qwen-Image的发展历程

在Qwen-Image-2.0发布之前,阿里千问一直在探索生图和编辑两条支线。8月发布的Qwen-Image着重于文字渲染的精准,而12月的Qwen-Image-2512则强化了细节质感和真实性。在编辑支线中,从8月的单图编辑到9月的多图编辑,再到12月的一致性提升,阿里千问不断推进技术的进步。

如今,Qwen-Image-2.0成功将两条支线合二为一,并在两个任务上均取得了理想的结果。

模型特点与技术突破

Qwen-Image-2.0在效果上有几个显著特点。首先,它能够生成复杂的“画中画”效果。例如,模型可以根据提示词准确渲染多层次的图像内容,并保持一致性。这种能力使得模型在制作专业PPT时更加得心应手。

此外,Qwen-Image-2.0支持1k token的指令,可以处理非常复杂的渲染指令。虽然复杂的提示词可能对用户不够友好,但通过大语言模型(LLM)的世界知识,可以轻松获得详细的描述。

“Qwen-Image-2.0不仅在文字渲染上表现出色,其在图像编辑中的增强也令人兴奋。”

文字渲染的五大特性

Qwen-Image-2.0在文字渲染上具有“准”、“多”、“美”、“真”、“齐”五大特性。模型不仅能够在不同介质上准确渲染文字,还能在写实图片和文字同时出现时,保证真实性和一致性。

在文字的排版布局上,Qwen-Image-2.0也有出色表现。例如,在生成图和字的混合画面时,模型会倾向于在空白处渲染文字,以不遮盖图像主体。此外,模型支持多种字体,如宋徽宗赵佶的瘦金体和《兰亭集序》中的小楷。

“这种真实感也体现在电影海报等应用中,模型在准确渲染文字的同时,保持了图像的真实性。”

图像编辑的增强与应用

除了文生图,Qwen-Image-2.0在图像编辑中也获得了显著增强。作为一个生图编辑二合一的模型,文字渲染和真实质感的增益同样适用于图像编辑。例如,模型可以直接在图片上题词,带来更多有趣的应用。

这种增强使得用户可以上传任意照片,并让模型在上面题诗或进行其他创意编辑。编辑的真实质感也得到了提升,模型能够在不同次元的图像中实现自然过渡。

Qwen-Image-2.0的发布标志着阿里千问在图像生成技术上的又一突破。随着技术的不断进步,未来该模型在各个领域的应用前景广阔。

推荐阅读  春节AI应用流量争夺战升级:腾讯追加百万现金红包