VAE 变分下界(VLB)推导通过变分推断优化负对数似然,最终转化为可计算的 KL 散度组合。

问题定义

目标:最小化观测数据 的负对数似然:

挑战:直接计算 需边缘化隐变量 ,涉及高维积分。

推导步骤

1. 引入变分分布与 Jensen 不等式

Jensen 不等式将积分外提,得到下界(ELBO)。

2. 马尔可夫链分解

3. 条件概率重组

4. 最终目标函数

各项物理意义

含义
约束最终状态 与先验分布对齐
约束反向生成过程逼近前向扩散后验
重构损失,确保生成数据与原始数据一致

核心思想总结

  1. 变分推断框架:引入变分分布 ,将不可计算的边缘似然转化为可优化的下界
  2. Jensen 不等式:将积分问题转化为期望的优化问题
  3. 马尔可夫链分解:将联合分布拆解为可建模的条件概率
  4. KL 散度最小化:将生成过程与扩散过程对齐