【阿里拥抱开源】Qwen Image团队开源图像分解模型—

简介

我们很高兴推出Qwen-Image-Layered模型，该模型能够将图像分解为多个RGBA图层。这种分层表示解锁了内在可编辑性：每个图层可以独立操作而不影响其他内容。同时，这种分层表示天然支持高保真基础操作——例如调整大小、重新定位和重新着色。通过将语义或结构组件物理隔离到不同图层中，我们的方法实现了高保真且一致的编辑。

快速开始

确保您的transformers版本≥4.51.3（支持Qwen2.5-VL）
安装最新版diffusers

pip install git+https://github.com/huggingface/diffusers pip install python-pptx

fromdiffusersimportQwenImageLayeredPipelineimporttorchfromPILimportImage pipeline=QwenImageLayeredPipeline.from_pretrained("Qwen/Qwen-Image-Layered")pipeline=pipeline.to("cuda",torch.bfloat16)pipeline.set_progress_bar_config(disable=None)image=Image.open("asserts/test_images/1.png").convert("RGBA")inputs={"image":image,"generator":torch.Generator(device='cuda').manual_seed(777),"true_cfg_scale":4.0,"negative_prompt":" ","num_inference_steps":50,"num_images_per_prompt":1,"layers":4,"resolution":640,# Using different bucket (640, 1024) to determine the resolution. For this version, 640 is recommended"cfg_normalize":True,# Whether enable cfg normalization."use_en_prompt":True,# Automatic caption language if user does not provide caption}withtorch.inference_mode():output=pipeline(**inputs)output_image=output.images[0]fori,imageinenumerate(output_image):image.save(f"{i}.png")

案例展示

应用中的分层解构

给定一张图像，Qwen-Image-Layered可将其分解为多个RGBA图层：

分解后，编辑操作仅作用于目标图层，使其在物理层面与其他内容隔离，从而从根本上确保编辑的一致性。

例如，我们可以单独对首层重新着色，同时保持其他所有内容不受影响：

我们也可以将第二层从女孩替换为男孩（目标层使用Qwen-Image-Edit进行编辑）：

我们将文本修改为“Qwen-Image”（目标图层使用Qwen-Image-Edit进行编辑）：

此外，分层结构天然支持基础操作。例如，我们可以彻底删除不需要的对象。

我们也可以在不失真的情况下调整对象大小：

分层解构后，我们可以在画布上自由移动对象：

灵活可迭代的分层

Qwen-Image-Layered 不局限于固定分层数量。该模型支持可变层数分解，例如根据需求可将图像分解为3层或8层：

此外，分解可以递归应用：任何层级本身都可以进一步分解，从而实现无限分解。

许可协议

Qwen-Image-Layered 采用 Apache 2.0 许可证授权。

引用说明

如果您认为我们的工作对您有所帮助，我们诚挚地建议您引用相关成果。

@misc{yin2025qwenimagelayered, title={Qwen-Image-Layered: Towards Inherent Editability via Layer Decomposition}, author={Shengming Yin, Zekai Zhang, Zecheng Tang, Kaiyuan Gao, Xiao Xu, Kun Yan, Jiahao Li, Yilei Chen, Yuxiang Chen, Heung-Yeung Shum, Lionel M. Ni, Jingren Zhou, Junyang Lin, Chenfei Wu}, year={2025}, eprint={2512.15603}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2512.15603}, }

基于VUE的好利来蛋糕销售网站[VUE]-计算机毕业设计源码+LW文档

摘要：随着互联网技术的发展和消费者购物习惯的转变，线上销售成为蛋糕行业的重要渠道。本文以好利来蛋糕销售网站为研究对象，阐述基于VUE框架开发该网站的过程。网站涵盖系统用户管理、新闻数据管理、变幻图设置、留言管理、类别管理、门店管理…

李华

拒绝无效加班！免费 RPA 工具合集，轻松搞定数据录入 / 报表整理

每天重复录入数据到深夜？报表整理、订单统计、多平台内容分发占用大量时间？其实你不用这么累——免费RPA就能帮你解放双手。作为数字经济时代的效率神器，免费RPA不仅能零成本解决重复性工作难题，还能让非技术人员轻松上手自动化操…

李华

【Open-AutoGLM量子协同突破】：揭秘量子计算与大模型融合的5大核心技术

第一章：Open-AutoGLM量子协同突破的背景与意义近年来，人工智能与量子计算的交叉研究成为科技前沿的重要方向。Open-AutoGLM作为首个开源的自动推理大语言模型，结合量子协同计算框架，实现了在复杂逻辑推理任务中的指数级加速。这一…

李华

基于YOLOv11的苹果成熟度识别检测系统（YOLOv11深度学习+YOLO数据集+UI界面+登录注册界面+Python项目源码+模型）

一、项目介绍本文基于YOLOv11深度学习框架，开发了一套苹果成熟度识别检测系统，能够高效准确地识别苹果的成熟度等级（20%成熟、50%成熟、75%成熟、100%成熟）及腐烂状态。系统采用的YOLO格式数据集，包含训练集&#xf…

李华

5个策略帮助企业充分利用YashanDB数据库

在当前数据驱动的业务环境中，企业面临着数据库系统性能瓶颈、数据一致性保障和高可用性需求等共性挑战。随着数据量和并发访问的增长，数据库的存储管理、事务处理和查询优化能力成为影响业务效率的关键因素。YashanDB作为一款支持单机、分布式及共享集群…

李华

5个策略提升你对YashanDB数据库的掌控力

在现代数据驱动的业务环境中，如何优化数据库查询速度以满足高并发和大数据量的访问需求，成为数据库管理核心的挑战之一。YashanDB作为具备多形态部署能力、灵活存储结构及高可用机制的数据库，提供了丰富的技术架构和功能组件。本篇文章将深入…

李华