扩散模型(Diffusion Models)在视觉生成领域取得了举世瞩目的成就,但其昂贵的迭代采样过程——通常需要几十甚至上百步推理——极大限制了实时应用部署。
近期,关于扩散模型蒸馏(DMD) 的两篇重量级论文引发了学术界与工业界的广泛关注。它们不仅刷新了 4 步成像的质量极限,更从根本上重新定义了“蒸馏”的本质。
DMDR
蒸馏遇上强化学习,青出于蓝而胜于蓝

论文:Distribution Matching Distillation Meets Reinforcement Learning
链接:https://arxiv.org/abs/2511.13649
代码:https://github.com/vvvvvjdy/dmdr
传统的分布匹配蒸馏(DMD)旨在让“学生模型”模仿“老师模型”的输出分布,但这导致学生的能力往往受限于老师的水平。
1. 深度融合:DMD 与 RL 的双向奔赴


DMDR 提出将强化学习(RL)与蒸馏过程同步进行,这种组合产生了两大互补效应:
- RL 为蒸馏“提质”: RL 能够引导学生模型跳出教师分布中的低质量区域,覆盖更高奖励(如更高审美、更好对齐)的模式,从而解决蒸馏中的模式缺失(Zero forcing) 问题。
- DMD 为 RL “护航”: 扩散模型的 RL 极易陷入奖励作弊(Reward hacking),而 DMD 损失函数充当了极佳的正则化项,确保模型在追求高奖励时不会偏离真实的图像分布。
2. 核心黑科技:动态冷启动
由于 RL 在训练初期需要模型具备基础能力,作者设计了两大策略:
- DynaDG(动态分布引导): 通过小规模 LoRA 动态调整分布,增强师生模型初期的分布重叠度,提供更可靠的优化梯度。
- DynaRS(动态重噪采样): 初期优先采样高噪声水平,让模型先攻克全局结构,随着能力提升再转向细粒度细节。
结论: 在 SDXL 和 SD3 等模型上的实验证明,DMDR 仅需 4 步生成的图像质量甚至能超越其多步迭代的教师模型。
Decoupled DMD
重新定义蒸馏的“矛与盾”

论文:Decoupled DMD: CFG Augmentation as the Spear, Distribution Matching as the Shield
链接:https://arxiv.org/abs/2511.13649
链接:https://github.com/Tongyi-MAI/Z-Image
这篇论文挑战了传统认知:DMD 的成功真的是因为“分布匹配”吗?
1. 机制拆解:谁才是真正的“引擎”?

通过对 DMD 梯度公式的严密分解,作者发现驱动多步模型转向少步模型的动力源并非分布匹配(DM),而是长期被忽视的 CFG 增强(CFG Augmentation, CA):
- CA (矛/引擎): 负责将 CFG 信号直接“烘焙”进生成器中,是少步转换的核心驱动力。
- DM (盾/正则化器): 其主要作用是抑制 CA 带来的伪影(如过饱和、高频噪声),确保训练稳定。
2. 创新方案:解耦重噪计划 (Decoupled Schedule)

基于此发现,作者提出 CA 和 DM 不应共用采样计划:
- CA 需“聚焦”: 针对当前步骤 t,CA 只需关注尚未解析的噪声范围(即 \tau > t)。
- DM 需“全局”: 为了纠正全局性偏差(如色彩),DM 必须始终覆盖全范围噪声。
这种 Decoupled-Hybrid(解耦混合) 策略显著提升了细节丰富度,并消除了过饱和问题,目前已被 Z-Image 项目采纳。
3. 跨界类比:像 LLM 一样预测
作者提出了一个有趣的视角:扩散模型的逐步生成类似于大语言模型(LLM)的逐个 token 预测。CFG 就像是一种外部干预,而 CA 的作用就是将这种“预测路径”确定化,从而将原本复杂的决策树塌缩为一条直接生成的路径。
总结:蒸馏技术的范式转移
这两篇论文共同展示了扩散模型蒸馏正在经历一场变革:
- 从“模仿”到“超越”: 结合 RL 的 DMDR 证明了学生可以比老师更优秀。
- 从“黑盒”到“解耦”: Decoupled DMD 拆解了算法的内在逻辑,通过“矛与盾”的分工实现了更完美的生成效果。
如果把少步成像比作一场短跑,DMDR 给了运动员更科学的训练反馈,而 Decoupled DMD 则精确优化了运动员每一块肌肉的发力计划。

1月13日(周二)晚8点,青稞社区和减论平台将联合组织青稞Talk 第103期,阿里巴巴通义实验室实习生、西北工业大学本科&香港科技大学预备博士姜登阳,将直播分享《Decoupled DMD & DMDR: 在扩散模型步数蒸馏的实践及 Z-Image-Turbo 应用》。
主题提纲
Decoupled DMD & DMDR: 在扩散模型步数蒸馏的实践及 Z-Image-Turbo 应用
1、什么是分布匹配蒸馏(DMD)?
2、Decoupled-DMD:重新思考DMD work的方式
3、DMDR:如何更好地将 RL 引入少步模型
4、在 Z-Image-Turbo 的效果展示
5、AMA (Ask Me Anything)环节
直播时间
1月13日(周二)20:00 - 21:00
如何观看
Talk 将在青稞社区【视频号:青稞AI、Bilibili:青稞AI】上进行直播,欢迎观看~
https://live.bilibili.com/32145701