扩散模型假设所有 为高斯分布,本质是为数学可解性与训练稳定性牺牲严格性的折中方案。
扩散过程的高斯分布假设本质
前向扩散过程定义为马尔可夫链,每一步通过高斯噪声扰动:
其中 控制噪声强度。 的条件分布是高斯分布,但边缘分布在 较小时并非严格高斯分布,仍保留原始数据 的多模态特征。
较小时的实际分布与模型假设的差异
- 真实分布的非高斯性:当 接近 0 时, 是 叠加少量噪声的结果,分布应接近原始数据的复杂多模态分布
- 模型假设的简化目的:
- 数学可处理性:高斯分布的线性可加性、闭合解使前向/反向过程推导可行, 可直接由 表示:
- 训练稳定性:高斯假设使损失函数(如 KL 散度)有闭式解,避免复杂分布的优化困难
高斯假设的合理性:渐近收敛与中心极限定理
- 渐近高斯性:随着 增大( 递增),多次独立高斯噪声的叠加使 收敛到标准高斯分布
- 反向过程的可行性基础:若前向过程的高斯转移核足够小(),则逆过程在 较大时接近高斯分布,神经网络可通过参数化均值 和方差 拟合复杂映射
实践中的有效性证明
扩散模型在图像生成中的成功证明高斯假设虽为近似,但通过以下设计仍能有效建模复杂数据分布:
- 时间步相关的参数化:神经网络根据 动态调整预测的噪声 ,自适应不同 下 的分布特性
- 损失函数设计:通过最小化预测噪声与真实噪声的均方误差,间接拟合非高斯分布的转换过程
总结
高斯假设是实用性与理论妥协的结果:
- 较小时: 的真实分布确实非高斯,但高斯转移核提供平滑的扰动路径
- 反向去噪的可行性:神经网络参数化高斯分布的均值和方差,能够学习从噪声到数据的复杂映射
生成效果验证表明,高斯分布足以作为复杂分布的有效代理,实现高质量生成。