通义千问Qwen-Image-Edit发布:兼具语义与外观双重编辑能力
科技
科技 > 滚动 > 正文

通义千问Qwen-Image-Edit发布:兼具语义与外观双重编辑能力

凤凰网科技讯 8月19日,通义千问Qwen宣布推出Qwen-Image-Edit,Qwen-Image的图像编辑版本。

Qwen-Image-Edit基于20B的Qwen-Image模型进⼀步训练,成功将Qwen-Image的独特的文本渲染能力延展至图像编辑领域,实现了对图片中文字的精准编辑。

此外,Qwen-Image-Edit将输⼊图像同时输⼊到Qwen2.5-VL(实现视觉语义控制)和 VAE Encoder(实现视觉外观控制),从而兼具语义与外观的双重编辑能力。

通义千问Qwen-Image-Edit发布:兼具语义与外观双重编辑能力

通义千问Qwen-Image-Edit发布:兼具语义与外观双重编辑能力

通义千问Qwen-Image-Edit发布:兼具语义与外观双重编辑能力

通义千问Qwen-Image-Edit发布:兼具语义与外观双重编辑能力

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载