Diffusion
共 10 篇文章
变分自编码器(VAE)的理论基础,详见苏剑林博客系列。
学习资源
- 苏剑林《变分自编码器系列 …
扩散模型通过条件嵌入机制将外部信息融入去噪过程,主要方式包括交叉注意力、归一化参数动态调整、时间步联合嵌入等。
条件类型
文本条件
- CLIP 语义对齐:文本通过 CLIP 编码器生成语义向量,作为交叉注意力 Key/Value
- 交叉注 …
扩散模型损失函数以噪声预测 L2 损失(离散时间)和分数匹配损失(连续时间)为核心,其他损失多为其变体或扩展。
基础噪声预测损失
噪声预测 L2 损失(DDPM 核心)
$$\mathcal{L}{\text{simple}} = …
Diffusion Model 基于马尔可夫链实现逐步加噪与去噪,已成为生成式 AI 的核心引擎。
定义与发展历程
Diffusion Model 是一类基于马尔可夫链的生成式模型,通过逐步添加噪声破坏数据分布,再学习逆向去噪过程重建数 …
扩散模型学习路线分为四个阶段:基础入门 → 理论深化 → 进阶模型 → 应用实践,涵盖从 DDPM 到 Stable Diffusion 的完整知识体系。
学习路线总览
| 阶段 … |
|---|
Diffusion Model 基于马尔可夫链实现逐步加噪与去噪,已成为生成式 AI 的核心引擎。
定义与发展历程
Diffusion Model 是一类基于马尔可夫链的生成式模型,通过逐步添加噪声破坏数据分布,再学习逆向去噪过程重建数 …
Diffusion Transformers(DiT)融合 Transformer 架构与扩散模型,通过全局建模能力和卓越扩展性重塑图像与视频生成范式。
概述
DiT 是一种将 Transformer 架构与扩散模型相结合的生成式模型。 …
扩散模型与 Transformer 的融合通过全局建模能力和灵活条件注入显著提升生成质量与可控性。
结合机制
主干网络替换(DiT)
DiT(Diffusion Transformer)直接用 Transformer 替代传统 …
Diffusion 模型学习资源导航,涵盖综述、博客、论文和应用。
高质量综述
- What are Diffusion Models? — 英文入门介绍
- [[Diffusion Models A Comprehensive Survey …
扩散模型综述资源汇总,涵盖核心论文仓库与关键技术问题。
综述资源
核心问题
| 问题 … |
|---|
张芷铭的个人博客