Diffusion Loss推导详细解释

VAE 变分下界（VLB）推导通过变分推断优化负对数似然，最终转化为可计算的 KL 散度组合。

问题定义

目标：最小化观测数据 $x_{0}$ 的负对数似然：

$L_{CE} = - E_{q (x_{0})} lo g p_{θ} (x_{0})$

挑战：直接计算 $p_{θ} (x_{0})$ 需边缘化隐变量 $x_{1 : T}$ ，涉及高维积分。

推导步骤

1. 引入变分分布与 Jensen 不等式

$L_{CE} \leq - E_{q (x_{0 : T})} lo g \frac{p _{θ} ( x _{0 : T} )}{q ( x _{1 : T} ∣ x _{0} )} = L_{VLB}$

Jensen 不等式将积分外提，得到下界（ELBO）。

2. 马尔可夫链分解

$L_{VLB} = E_{q (x_{0 : T})} [lo g \frac{\prod _{t = 1}^{T} q ( x _{t} ∣ x _{t - 1} )}{p _{θ} ( x _{T} ) \prod _{t = 1}^{T} p _{θ} ( x _{t - 1} ∣ x _{t} )}]$

3. 条件概率重组

$L_{VLB} = E_{q} [lo g \frac{q ( x _{T} ∣ x _{0} )}{p _{θ} ( x _{T} )} + \sum_{t = 2}^{T} lo g \frac{q ( x _{t - 1} ∣ x _{t} , x _{0} )}{p _{θ} ( x _{t - 1} ∣ x _{t} )} - lo g p_{θ} (x_{0} ∣ x_{1})]$

4. 最终目标函数

$L_{VLB} = E_{q} L_{T} D_{KL} (q (x_{T} ∣ x_{0}) ∥ p_{θ} (x_{T})) + \sum_{t = 2}^{T} L_{t - 1} D_{KL} (q (x_{t - 1} ∣ x_{t}, x_{0}) ∥ p_{θ} (x_{t - 1} ∣ x_{t})) L_{0} - lo g p_{θ} (x_{0} ∣ x_{1})$

各项物理意义

项	含义
$L_{T}$	约束最终状态 $x_{T}$ 与先验分布对齐
$L_{t - 1}$	约束反向生成过程逼近前向扩散后验
$L_{0}$	重构损失，确保生成数据与原始数据一致

核心思想总结

变分推断框架：引入变分分布 $q$ ，将不可计算的边缘似然转化为可优化的下界
Jensen 不等式：将积分问题转化为期望的优化问题
马尔可夫链分解：将联合分布拆解为可建模的条件概率
KL 散度最小化：将生成过程与扩散过程对齐

知识花园

探索